Практичният избор: Предприятията често предпочитат по-малките AI модели
Понякога не е необходим модел на изкуствен интелект, който да познава целия актьорски състав на "Кръстникът", или всеки филм, който някога е бил създаден
Компаниите все по-често внедряват малки и средни модели за генериране на изкуствен интелект, като предпочитат намалената и рентабилна технология пред големите и лъскави инструменти, които се появиха в началото на бума на изкуствения интелект.
За разлика от основополагащите модели, като GPT-4 на OpenAI, чието разработване е струвало над 100 млн. долара и който използва повече от един трилион параметри, което е показател за неговия размер, по-малките модели се обучават на намалено количество данни и често са предназначени за специфични задачи.
Почти всички производители на инструменти, включително Microsoft и Google, както и стартъпи като Mistral, Anthropic и Cohere, се стремят да предлагат повече от тези видове модели.
Главните информационни директори казват, че за някои от най-често срещаните случаи на използване на изкуствен интелект, които често са свързани с ограничени, повтарящи се задачи като класифициране на документи, по-малките и средните модели просто имат по-голям смисъл. И тъй като използват по-малко изчислителна мощност, излизат евтино за експлоатация.
Промяната идва, тъй като компаниите бавно преминават към внедряване на технологията, като същевременно са подложени на натиск да управляват разходите и възвръщаемостта на скъпите инвестиции в AI.
"Един гигантски LLM [голям езиков модел], който е обучен върху цялата световна мрежа, може да бъде огромен излишък", казва пред The Wall Street Journal Робърт Блумоф, главен технологичен директор в компанията за киберсигурност и облачни изчисления Akamai.
За случаите на използване в предприятията, казва той, "не е необходим модел на изкуствен интелект, който да познава целия актьорски състав на "Кръстникът", всеки филм, който някога е бил създаден, да е на ясно с всяко телевизионно предаване, което някога е създадено."
Оливър Паркър, вицепрезидент на глобалния пазар на генеративен изкуствен интелект в Google Cloud, посочва, че през последните три месеца е видял, че предприятията се преориентират към средни модели, отчасти защото те отговарят на по-практични критерии.
Големите модели все още имат значение и стойност за сложни случаи на употреба, изискващи много данни, творчество и тълкуване. Например един такъв модел би бил подходящ за поглъщане на всички произведения на Шекспир и анализиране на женските персонажи спрямо мъжките с течение на времето, пише WSJ. Но това просто не влиза в списъка на доста компании