„Суверенният AI“ – пътят към технологична независимост на Европа
Европейските компании се насочват към модели, контролирани, внедрявани и разработвани на местно ниво от местни таланти за местното население
Технологичните гиганти инвестират все повече в разработването на т.нар. „суверенни“ модели на изкуствен интелект (AI). По този начин те се стремят да повишат конкурентоспособността си, като се фокусират повече върху местната инфраструктура.
Суверенитетът се отнася до идеята, че данните на хората трябва да се съхраняват в инфраструктура в рамките на страната или континента, в който те живеят.
„Суверенният изкуствен интелект е сравнително нов термин, който се появи през последната година“, коментира пред CNBC Крис Гоу, ръководител на публичната политика за ЕС на гиганта в областта на ИТ мрежите Cisco.
Понастоящем много от най-големите големи езикови модели (LLM), като ChatGPT на OpenAI и Claude на Anthropic, използват центрове за данни, базирани в САЩ, за да съхраняват данни и да обработват заявки чрез облака. Това предизвиква безпокойството на политиците и регулаторните органи в Европа, които смятат, че зависимостта от американските технологии вреди на конкурентоспособността на континента и, което е по-притеснително, на технологичната му устойчивост.
Откъде идва „суверенитетът“ на изкуствения интелект“?
Идеята за суверенитет на данните и технологиите е нещо, което и преди е било в дневния ред на Европа. Тя се появи отчасти в резултат на реакцията на предприятията на новите разпоредби на блока.
Например Общият регламент за защита на данните на Европейския съюз (GDPR) изисква от дружествата да обработват данните на потребителите по сигурен и съвместим начин, който зачита правото им на неприкосновеност на личния живот. Различни казуси породиха съмнения относно това дали данните за европейските граждани могат да се предават безопасно през границите.
През 2020 г. Съдът на Европейския съюз обяви за невалидна рамка за обмен на данни между ЕС и САЩ с мотива, че пактът не осигурява същото ниво на защита, каквото се гарантира в границите на блока от GDPR. Миналата година беше създадена рамката за защита на личните данни между ЕС и САЩ, за да се гарантира, че те могат да се движат безопасно между двата региона. Тези политически развития в крайна сметка доведоха до стремеж към локализиране на облачната инфраструктура, където се съхраняват и обработват данните за много онлайн услуги.
Филипо Санеси, глобален ръководител на маркетинга и операциите в OVHCloud, посочва, че френската компания за облачни услуги наблюдава много голямо търсене на своята локализирана в Европа инфраструктура. Причината, според него, е, че компаниите „разбират стойността на това да разполагат с данните си, които са обект на европейското законодателство, в Европа, “.
„Тъй като тази концепция за суверенитет на данните става все по-зряла и хората разбират какво означава тя. Виждаме, че все повече компании разбират значението на това да разполагат с данните си локално и под определена юрисдикция и управление“, казва Санези пред CNBC. „Имаме много данни, като те са суверенни - в конкретни държави, под конкретни регулации.“
По думите му това позволява на европейските компании да създават суверенни AI продукти и услуги, които са „контролирани, внедрявани и разработвани на местно ниво от местни таланти за местното население или предприятия.“
Стремежът към суверенитет на AI не е бил подтикнат от регулаторите - поне все още не, според Гоу от Cisco. По-скоро той идва от частни компании, които отварят повече центрове за данни в Европа.
„Суверенният изкуствен интелект е по-скоро движен от индустрията, която го нарича така, отколкото от страна на политиците“, акцентира той. „Все още не виждаме терминологията „суверенитет на AI“ да се използва от страна на регулаторите“.
Той смята, че страните прокарват идеята за суверенитет на AI, защото признават, че AI е „бъдещето“ и „масивна стратегическа технология“. Правителствата се фокусират върху стимулирането на националните си технологични компании и екосистеми, както и върху важната инфраструктура, която позволява предоставянето на услуги с AI.
„Работното натоварване с AI използва 20 пъти по-голяма честотна лента от традиционното работно натоварване“, казва Гоу, като добавя, че става въпрос и за осигуряване на възможности за работната сила, тъй като компаниите се нуждаят от квалифицирани работници, за да бъдат успешни.
Най-важното от всичко обаче са данните.
Отразяване на ценностите
В Италия това лято стартира първият LLM, обучен специално върху данни за италианския език, наречен Italia 9B. Целта на проекта е да съхранява цялата информация в конкретната юрисдикция и да разчита на данни от граждани в този регион, така че резултатите, изготвени от системите, да са по-свързани с местните езици, култура и история.
„Суверенният AI трябва да отразява ценностите на дадена организация или в еднаква степен на страната, в която се намирате, както и ценностите и езика“, казва Дейвид Хоган, ръководител на отдел „Продажби на корпоративни продукти“ за EMEA в гиганта в производството на чипове Nvidiа. „Основното предизвикателство е, че повечето от моделите днес са били обучени предимно върху западни данни като цяло“.
В Дания например, където Nvidia има голямо присъствие, официалните лица са обезпокоени от това, че жизненоважни услуги като здравеопазване и телекомуникации се предоставят от системи с изкуствен интелект, които „не „отразяват местната датска култура и ценности“, според Хоган.
В сряда страната представи забележителна бяла книга, в която се посочва как компаниите могат да използват технологията в съответствие със Закона ЕС за изкуствения интелект (AI Act) – първото мащабно законодателство за изкуствения интелект в света. Документът е предназначен да послужи като модел, който да бъде последван и приет от други държави от ЕС.
„Ако се намирате в европейска държава, която не говори на един от основните езици в международен план, вероятно по-малко от 2% от данните са обучени на вашия език - да не говорим за вашата култура“, категоричен е Хоган.
Как регулацията стимулира промяна в мисленето
Това не означава, че регулациите не са се оказали важен фактор, който е накарал технологичните гиганти да мислят повече за изграждането на локализирана инфраструктура за изкуствен интелект в Европа.
Санеси от OVHCloud коментира, че регулации като GDPR са катализирали голяма част от интереса към оншоринг обработката на данни в даден регион. Концепцията за суверенитет на AI също така получава подкрепа от местните европейски технологични компании.
По-рано тази седмица базираната в Берлин търсачка Ecosia и базираният в Париж неин колега Qwant обявиха съвместно предприятие за разработване на европейски индекс за търсене от нулата, като целта е да се предоставят подобрени резултати на френски и немски език.
Междувременно френският телекомуникационен оператор Orange съобщи, че обсъжда с редица компании, създаващи модели за изкуствен интелект, изграждането на суверенен модел, подходящ за смартфони, който по-точно да отразява езика и културата на неговите клиенти.
„Не би имало смисъл да изграждаме свои собствени модели на всеки език. Затова в момента се обсъжда много въпросът как да си партнираме със съществуващите доставчици, за да го направим по по-локален и по-сигурен начин“, обяснява Бруно Зербиб, главен технологичен директор на Orange. „Има много случаи на употреба, при които данните за AI могат да се обработват локално на телефона, вместо в облака“.