Китайски изкуствен интелект създава клипове от снимки
Докато OpenAI само е казвала, че нейният модел Sora разполага с подобни възможности, китайската Shengshu вече печели пари от своя Vidu
Базираната в Пекин компания Shengshu Technology обяви в сряда, че нейният инструмент за преобразуване на текст във видео, базиран на изкуствен интелект, Vidu вече ще може да генерира видеоклипове чрез комбиниране на изображения.
Vidu вече позволява на потребителите в цял свят да създават 8-секундни клипове въз основа на писмени указания. Въпреки че през февруари OpenAI - създателят на ChatGPT - разкри, че неговият модел на изкуствен интелект Sora може да генерира едноминутни видеоклипове от текст, той все още не го е представил на широката публика.
„Новата функция на Vidu може да комбинира три снимки - като риза, човек и мотопед - във видеоклип на човека, който носи ризата и кара мотопеда през дадена сцена“, обясняват от Shengshu, цитирани от CNBC.
И други платформи твърдят, че могат да превръщат текст или изображения във видеоклипове с помощта на AI, но качеството на резултатите е различно. Пробивът, за който претендира Shengshu, е възможността да се вземат три уникални изображения и да се интегрират с визуална последователност във видеоклип, генериран от AI.
„Много рано посочихме визуалната съгласуваност като проблем и искахме да го решим добре“, казва Фан Бао, главен технологичен директор в Shengshu.
Vidu стартира през април и способността му да превръща две профилни снимки в реалистични видеоклипове на хора, които се прегръщат, стана хит в TikTok.
Генераторът на видеоклипове с изкуствен интелект вече печели пари от рекламодатели, аниматори и компании, разкрива съоснователят и главен изпълнителен директор на Shengshu Дзяю Танг. По думите му месечните такси за използване на платформата от един клиент могат да варират от 100 000 до 1 милион юана (13 871 до 138 711 долара).
За да се справи с проблемите, свързани с авторските права, Танг казва, че дадена компания може да подпише договор с художник, който позволява на изкуствения интелект да имитира стила на рисуването му за реклама. До момента Shengshu не се е сблъсквала със значими правни казуси, свързани с използването на изображения от потребителите.
Танг добавя, че Vidu не позволява на потребителите да генерират съдържание, използвайки изображения на известни личности или „чувствителни“ лица. Инструментът също така забранява голите тела и изображенията с насилие. Що се отнася до личните снимки, Танг казва, че Vidu унищожава данните в съответствие с общия регламент за защита на данните - световен еталон.
Shengshu е основана миналата година и се радва на влиятелни поддръжници, сред които Baidu Ventures, свързаната с Alibaba Ant Group, китайският стартъп Zhipu AI, Qiming Venture Partners и Beijing city, според PitchBook.