OpenAI представи дългоочаквания си инструмент за генериране на AI видео Sora

Моделът може да генерира видеоклипове, вдъхновени от снимки, да разширява съществуващи такива и да попълва липсващи кадри

Unsplash | През последните години шумът около агентите с изкуствен интелект нарасна драстично, въпреки че технологичната индустрия се затруднява да покаже на хората или дори да определи какво всъщност представляват те.

от profit.bg

Сподели Сподели Сподели Сподели

OpenAI пусна официално своя инструмент за генериране на видео с изкуствен интелект - Sora.

Моделът работи подобно на платформата DALL-E: потребителят описва желаната сцена и Sora връща видеоклип с висока разделителна способност. Той може също така да генерира видеоклипове, вдъхновени от неподвижни изображения, и да разширява съществуващи такива или да попълва липсващи кадри.

Sora дебютира за потребителите в САЩ, както и за „повечето държави в международен план“, в понеделник, но OpenAI все още няма „график“ за пускането му в Европа и Великобритания. Потребителите не трябва да плащат допълнително за инструмента, който ще бъде включен в съществуващите акаунти в ChatGPT Plus и Pro.

Досега Sora беше достъпен само за малка група от тестери по безопасността или „червени екипи“, които проверяват модела за уязвимости в области като дезинформация и пристрастия. През октомври потребители на Reddit попитаха ръководителите на OpenAI за датата на пускане на Sora, като зададоха въпроса дали моделът се бави „заради количеството изчисления/време, необходими за изводите, или заради безопасността“. В отговор продуктовият шеф на OpenAI Кевин Уейл написа: „Трябва да се усъвършенства моделът, трябва да се осигури безопасността и да се подобрят изчисленията!“

„Очевидно е, че като OpenAI имаме голяма мишена на гърба си“, заявява и Рохан Сахай, продуктов ръководител на Sora в OpenAI, по време на представянето на модела, добавяйки, че компанията трябва да предотврати незаконното използване на технологията. „Но също така искаме да балансираме между това и творческото изразяване.“

Докато OpenAI само е казвала, че нейният модел Sora разполага с подобни възможности, китайската Shengshu вече печели пари от своя Vidu

Китайски изкуствен интелект създава клипове от снимки

OpenAI приключи последния си кръг на финансиране през октомври при оценка от 157 млрд. долара, включително 6,6 млрд. долара, които компанията набра от широк списък от инвестиционни и големи технологични компании. Тя получи и револвираща кредитна линия на стойност 4 млрд. долара, с което общата ѝ ликвидност достигна над 10 млрд. долара, припомня CNBC.

Всичко това е част от сериозен план за растеж на OpenAI. Подкрепяната от Microsoft компания е в люта конкуренция с Anthropic (подкрепяна от Amazon) и xAI на Илон Мъск. Google и Meta също имат амбиции на пазара на генеративен изкуствен интелект, който се очаква да достигне 1 трилион долара в рамките на едно десетилетие.

По-рано този месец OpenAI нае първия си главен маркетинг директор, което показва, че планира да харчи повече за реклама, за да увеличи потребителската си база. През октомври стартъпът дебютира с функция за търсене в ChatGPT, с която влезе в директна конкуренция с водещи търсачки като Google, Bing на Microsoft и Perplexity.

Още преди да стане широкодостъпен новият модел за генериране на видеоклипове на OpenAI предизвиква както огромно вълнение, така и чувство на обреченост. Какви са аргументите на оптимистите и песимистите?

От надежди за по-висока творческа продуктивност до страхове за мрачно бъдеще: Какво ще стане, когато Sora попадне в ръцете ни?

Със Sora OpenAI се включва и на полето на AI инструментите за генериране на видеоклипове. Там вече са компании като Meta и Google, които обявиха Lumiere през януари. Подобни платформи се предлагат и от други стартиращи компании. Такава е например Stable Video Diffusion на Stability AI. Amazon пък пусна Create with Alexa - модел, който е специализиран в генерирането на кратки анимационни клипчета за деца на базата на подкани.

Видеото може да бъде следващото постижение на генеративния изкуствен интелект, след като чатботовете и генераторите на изображения вече навлязоха в потребителския и бизнес свят. Но подобни възможности пораждат сериозни опасения за дезинформация, особено по време на избори. Броят на създадените дълбоки фалшификати, генерирани от изкуствен интелект, се е увеличил с 900% на годишна база, според данни на Clarity.

OpenAI превърна мултимодалността - комбинирането на генериране на текст, изображения и видео - в основна цел в усилията си да предложи по-широк набор от AI модели.

Сподели Сподели Сподели Сподели