OpenAI запустив штучний інтелект Sora, що генерує відео
Лабораторія досліджень штучного інтелекту OpenAI запустила штучний інтелект Sora, що вміє перетворювати текст і нерухоме зображення у відео або розширювати відео, яке вже існує, і заповнювати відсутні кадри в ньому.
AI Sora генерує відео тривалістю до хвилини за вказівками користувача. Тут можна створити деталізоване відео з багатьма персонажами, різними типами руху й кількома кадрами в ньому.
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
Утім, застосунок може поки не розуміти конкретні випадки причинно-наслідкових звʼязків або помилятися з просторовими вказівками: плутати ліве й праве, мати труднощі з хронологічно точним описом подій, зазначають розробники. «Наприклад, людина може відкусити шматочок печива, але після цього на печиві може не залишитися сліду від укусу», – додають у компанії.
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
Зараз AI доступний для red teamers – команди людей, які перевіряють безпеку застосунку, поширення в ньому дезінформації й контенту, що може розпалювати ненависть й упередження. Доступ до тестування надали й деяким художникам, дизайнерам і режисерам.
З питань безпеки для Sora також застосують класифікатор текстів OpenAI для перевірки й відхилення вказівок, у яких ідеться про насильство, сексуальний контент, образливі зображення, зокрема схожі на публічних людей або ті, що порушують інтелектуальну власність. Крім цього, OpenAI розробляє інструмент для виявлення оманливого контенту, який був згенерований у Sora.
У березні 2023 року OpenAI випустив нову «більш потужну» версію штучного інтелекту ChatGPT. GPT-4 може працювати одразу з текстом і зображеннями. Нейромережа аналізує текст і значення на зображеннях і може розвʼязувати задачі з ними.
Обкладинка: скриншот із відео OpenAI