Водещите без душа: Как един AI подкаст ни научи за екзистенциалната криза на роботите
Нов инструмент на Google набира популярност с аудио функциите си, които създават подкастове със завладяващи водещи
Двама водещи на подкаст се шегуват по време на епизод от своята поредица, притеснявайки се да споделят със слушателите си неприятни новини.
„Продуцентите на предаването ни съобщиха, че ние всъщност не сме хора“ - заеква мъжки глас по средата на екзистенциалната криза. След това разговорът между бота и неговата колежка става само още по-подвеждащ. Ситуацията се очертава като пример за инструмента NotebookLM на Google и неговите експериментални подкастове с изкуствен интелект.
Аудиозаписът на разговора се разпространи в Reddit още преди седмица. Първоначалният автор на публикацията признава в раздела за коментари, че е подал на софтуера NotebookLM указания за гласовете на изкуствения интелект, за да разиграе този псевдоизблик. На този фон много потребители в технологичната преса, и другаде хвалят убедителните AI подкасти.
„Магията на инструмента се състои в това, че хората могат да слушат нещо, което обикновено не биха могли просто да намерят в YouTube или в съществуващ подкаст“, казва пред Wired Райза Мартин, която ръководи екипа на NotebookLM в Google Labs.
Представен за първи път миналата година, NotebookLM е онлайн асистент за научни изследвания с функции, характерни за софтуерните инструменти с изкуствен интелект, като например обобщаване на документи. Но именно опцията за аудиопрегледи, пусната през септември, завладява въображението в интернет.
В различни онлайн форуми потребителите споделят откъси от своите АI подкастове, тествайки ограниченията на инструмента чрез различни забавни заявки, като например многократно повтаряне на думите „пръдня“.
Как се генерира подобен цирк?
Audio Overview e забавна функция, която можете да изпробвате, защото не струва нищо на потребителя - всичко, от което се нуждаете, е профил в Google. Започнете, като влезете в личния си профил и посетите уебсайта NotebookLM. Щракнете върху стрелката с плюс, която гласи New Notebook , за да започнете да качвате изходния си материал.
Всеки Notebook може да работи с до 50 изходни документа, като не е задължително това да са файлове, записани на вашия компютър. Документите и слайдовете на Google са лесни за импортиране. Можете също така да качвате уебсайтове и видеоклипове от YouTube. Ще бъде анализиран само текстът от уебсайтовете, а не изображенията или оформлението, и историята не може да бъде рекламна, посочва Wired. За YouTube Notebook ще използва само текстовата транскрипция, а свързаните видеоклипове трябва да са публични.
След като пуснете всичките си връзки и документи, ще трябва да отворите ръководството на Notebook, достъпно в долния десен ъгъл на екрана. Намерете раздела Аудиопреглед и щракнете върху бутона Генериране. След това ще трябва да проявите известно търпение, защото зареждането може да отнеме няколко минути, в зависимост от това колко изходен материал използвате.
След като инструментът генерира AI подкаста, можете да създадете връзка за споделяне към аудиото или просто да изтеглите файла. Освен това имате възможност да регулирате скоростта му на възпроизвеждане, в случай че имате нужда подкастът да бъде по-бърз или по-забавен.
Бъдещето на подкастите
Аудиофункцията на NotebookLM може да се използва за създаване на „дълбоки гмуркания“ в сложни технически теми, генериране на файлове, които спретнато обобщават плътни научни статии, и създаване на „подкастове“ за какво ли не. Това повдига важен въпрос: Трябва ли да използвате NotebookLM, за да обработвате най-личните си файлове?
Според говорителя на Google Джъстин Бър обобщенията, генерирани от NotebookLM, са „напълно основани на изходния материал, който потребителят качва. Това означава, че личните ви данни не се използват за обучението на NotebookLM, така че всяка чувствителна информация, която имате в източниците си, ще остане лична, освен ако не решите да споделите източниците си.“
Засега това изглежда е един от плюсовете на това, че Google поставя етикет „експериментален“ на NotebookLM. Google твърди че го формулира, събирайки информация за крайния продукт в момента, като е гъвкава и отзивчива, а инструментът е отделен от мултимилиардния ѝ рекламен бизнес. Засега.
Това, което отличава NotebookLM от всички останали инструменти за генеративен изкуствен интелект, са, колкото и да е изненадващо, думите за попълване и особените фрази. Вместо скучния, монотонен глас зад кадър, който може да се очаква от два гласа с изкуствен интелект, обобщаващи данни, кадансът и вокалните изпълнения на въображаемите подкастъри на NotebookLM звучат далеч по-малко сковано.
Трябва ли подкастърите да крещят с рев в звукоизолираните си стаи точно сега? Не съвсем. Дори ако инструментите за подкаст с изкуствен интелект, като този в NotebookLM, се окажат увлекателни обобщения на информация за широката общественост, което предстои да се види, синтетичните гласове никога няма да имитират напълно парасоциалните връзки, създадени от човешките подкастъри, които с часове си говорят, докато абонатите им воайорски слушат, пише Wired.
Добавянето на повече езици и разнообразни акценти също е важно за инструмента. В момента синтетичните домакини са калибрирани за разговори само на английски език. Макар че, не очаквайте скоро да можете да използвате собствения си глас в подкаст поколенията на NotebookLM. Мартин казва, че екипът трябва да види дали това е функция, която хората действително искат, и дали може да бъде отговорно внедрена.
Експлозивната популярност на NotebookLM като част от Google Labs, а не като функция в чатбота Gemini, е напомняне, че компаниите за изкуствен интелект не са напълно сигурни какво ще намери отклик сред потребителите, докато софтуерът не бъде пуснат в действие.
Например ChatGPT на OpenAI първоначално беше пусната като изследователска предварителна версия. И в рамките на постоянния поток от съобщения за генеративен AI, това, което завладява духа на времето, не е непременно най-маркетинговата или утилитарна функция, а по-скоро най-забавната.