OpenAI представи дългоочаквания си инструмент за генериране на AI видео Sora
Моделът може да генерира видеоклипове, вдъхновени от снимки, да разширява съществуващи такива и да попълва липсващи кадри
OpenAI пусна официално своя инструмент за генериране на видео с изкуствен интелект - Sora.
Моделът работи подобно на платформата DALL-E: потребителят описва желаната сцена и Sora връща видеоклип с висока разделителна способност. Той може също така да генерира видеоклипове, вдъхновени от неподвижни изображения, и да разширява съществуващи такива или да попълва липсващи кадри.
Sora дебютира за потребителите в САЩ, както и за „повечето държави в международен план“, в понеделник, но OpenAI все още няма „график“ за пускането му в Европа и Великобритания. Потребителите не трябва да плащат допълнително за инструмента, който ще бъде включен в съществуващите акаунти в ChatGPT Plus и Pro.
Досега Sora беше достъпен само за малка група от тестери по безопасността или „червени екипи“, които проверяват модела за уязвимости в области като дезинформация и пристрастия. През октомври потребители на Reddit попитаха ръководителите на OpenAI за датата на пускане на Sora, като зададоха въпроса дали моделът се бави „заради количеството изчисления/време, необходими за изводите, или заради безопасността“. В отговор продуктовият шеф на OpenAI Кевин Уейл написа: „Трябва да се усъвършенства моделът, трябва да се осигури безопасността и да се подобрят изчисленията!“
„Очевидно е, че като OpenAI имаме голяма мишена на гърба си“, заявява и Рохан Сахай, продуктов ръководител на Sora в OpenAI, по време на представянето на модела, добавяйки, че компанията трябва да предотврати незаконното използване на технологията. „Но също така искаме да балансираме между това и творческото изразяване.“
OpenAI приключи последния си кръг на финансиране през октомври при оценка от 157 млрд. долара, включително 6,6 млрд. долара, които компанията набра от широк списък от инвестиционни и големи технологични компании. Тя получи и револвираща кредитна линия на стойност 4 млрд. долара, с което общата ѝ ликвидност достигна над 10 млрд. долара, припомня CNBC.
Всичко това е част от сериозен план за растеж на OpenAI. Подкрепяната от Microsoft компания е в люта конкуренция с Anthropic (подкрепяна от Amazon) и xAI на Илон Мъск. Google и Meta също имат амбиции на пазара на генеративен изкуствен интелект, който се очаква да достигне 1 трилион долара в рамките на едно десетилетие.
По-рано този месец OpenAI нае първия си главен маркетинг директор, което показва, че планира да харчи повече за реклама, за да увеличи потребителската си база. През октомври стартъпът дебютира с функция за търсене в ChatGPT, с която влезе в директна конкуренция с водещи търсачки като Google, Bing на Microsoft и Perplexity.
Със Sora OpenAI се включва и на полето на AI инструментите за генериране на видеоклипове. Там вече са компании като Meta и Google, които обявиха Lumiere през януари. Подобни платформи се предлагат и от други стартиращи компании. Такава е например Stable Video Diffusion на Stability AI. Amazon пък пусна Create with Alexa - модел, който е специализиран в генерирането на кратки анимационни клипчета за деца на базата на подкани.
Видеото може да бъде следващото постижение на генеративния изкуствен интелект, след като чатботовете и генераторите на изображения вече навлязоха в потребителския и бизнес свят. Но подобни възможности пораждат сериозни опасения за дезинформация, особено по време на избори. Броят на създадените дълбоки фалшификати, генерирани от изкуствен интелект, се е увеличил с 900% на годишна база, според данни на Clarity.
OpenAI превърна мултимодалността - комбинирането на генериране на текст, изображения и видео - в основна цел в усилията си да предложи по-широк набор от AI модели.