Новини
16 лютого 2024, 11:36

OpenAI запустив штучний інтелект Sora, що генерує відео

Лабораторія досліджень штучного інтелекту OpenAI запустила штучний інтелект Sora, що вміє перетворювати текст і нерухоме зображення у відео або розширювати відео, яке вже існує, і заповнювати відсутні кадри в ньому.

AI Sora генерує відео тривалістю до хвилини за вказівками користувача. Тут можна створити деталізоване відео з багатьма персонажами, різними типами руху й кількома кадрами в ньому.


Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024

Згенероване у AI Sora відео. Вказівка: «Гарне, засніжене місто Токіо вирує. Камера рухається жвавою вулицею міста, слідуючи за кількома людьми, які насолоджуються прекрасною сніжною погодою й роблять покупки в найближчих кіосках. Розкішні пелюстки сакури летять на вітрі разом зі сніжинками».

Утім, застосунок може поки не розуміти конкретні випадки причинно-наслідкових звʼязків або помилятися з просторовими вказівками: плутати ліве й праве, мати труднощі з хронологічно точним описом подій, зазначають розробники. «Наприклад, людина може відкусити шматочок печива, але після цього на печиві може не залишитися сліду від укусу», – додають у компанії.


Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024

Згенероване у AI Sora відео. Вказівка: «Кілька гігантських мамонтів наближаються, ступаючи по засніженій галявині, їхнє довге хутро злегка розвівається на вітрі, коли вони йдуть. Укриті снігом дерева й драматичні засніжені гори вдалині, полуденне світло з купчастими хмарами, і сонце високо вдалині створює тепле сяйво, низький ракурс камери приголомшливо захоплює великого пухнастого ссавця з прекрасною фотографією, глибиною різкості».

Зараз AI доступний для red teamers – команди людей, які перевіряють безпеку застосунку, поширення в ньому дезінформації й контенту, що може розпалювати ненависть й упередження. Доступ до тестування надали й деяким художникам, дизайнерам і режисерам.

З питань безпеки для Sora також застосують класифікатор текстів OpenAI для перевірки й відхилення вказівок, у яких ідеться про насильство, сексуальний контент, образливі зображення, зокрема схожі на публічних людей або ті, що порушують інтелектуальну власність. Крім цього, OpenAI розробляє інструмент для виявлення оманливого контенту, який був згенерований у Sora.

У березні 2023 року OpenAI випустив нову «більш потужну» версію штучного інтелекту ChatGPT. GPT-4 може працювати одразу з текстом і зображеннями. Нейромережа аналізує текст і значення на зображеннях і може розвʼязувати задачі з ними.

Обкладинка: скриншот із відео OpenAI