AI модифицира човешки гласове в реално време в ново приложение за геймъри
Испанска компания за изкуствен интелект представи "AI humans" – инструменти с изкуствен интелект, които позволяват на потребители да променят гласовете си във видеоигри в реално време.
Базираната във Валенсия Voicemod пусна 20 човекоподобни персонажа, вариращи от 20-годишна жена до възрастен мъж. Гласовете им са обучени по гласове от професионални актьори с човешки глас.
При демонстрация на технологията пред CNBC главният изпълнителен директор на Voicemod Хайме Бош показа, че може да модифицира гласа си от високочестотен женски до баритонов мъжки глас.
Геймърите могат да изтеглят приложението и да включат технологията Voicemod като "виртуален микрофон", който се намира между приложението с микрофон, което използват, за да започнат да говорят чрез алтернативните лица.
Voicemod, в която работят таланти от водещи технически университети във Валенсия и Барселона, работи върху синтеза на глас и интерактивни аудио функции от 2014 г., като много от служителите ѝ специализират в областта на музикалните технологии и аудиото, допълва CNBC.
Използвана от повече от 40 милиона души, технологията на Voicemod може да се използва от потребителите в социалното приложение Discord, за да говорят помежду си с гласове, различни от техните, докато играят игри.
"Имаме невероятна творческа общност, която използва това главно, за да се забавлява, да се наслаждава с приятелите си и да има чувство за принадлежност", каза Бош в интервю за CNBC. "Един от най-честите случаи, който най-много ми харесва, са срамежливите хора - тези, които ни пишат, че не са в състояние наистина да общуват с хора, но сега вече го правят."
Това е крайъгълен камък в света на разговорния изкуствен интелект. Макар че много от днешните алгоритми позволяват на хората да изпращат текст и да получават обратно нещо, генерирано от AI, да се направи това в реално време, е много по-трудна задача.
Технологията обаче изисква значителна изчислителна мощ. Производството и патентоването на собствените алгоритмични модели, които стоят зад нея, изискват много инвестиции и талант. За тази цел Voicemod е набрала 23 млн. долара в брой от няколко рискови капиталисти, включително Leadwind и Bitkraft Ventures.
Бош е наясно и с рисковете как може да се злоупотреби с технологията – например, промяна на гласа може да се използва за имитация на водещи политически фигури или за измами. "Това е нещо, за което мисля всеки ден, когато става въпрос за създаване на гласове", допълва той.
Компанията е близо до завършването на решение за "воден знак", което може да идентифицира дали гласовете са генерирани с помощта на системи за модификация. Тя също така води дискусии с други фирми относно стандартизирането на такива системи и гарантирането на безопасното пускане на технологиите за промяна на гласове.
"Едно е сигурно - ще се появят ясни закони. Знаем, че Европа работи по този въпрос. Реалността е, че обикновено компаниите вървят по-бързо от законите.", допълва иноваторът.