Meta пусна нова колекция от модели с изкуствен интелект - Llama 4. Тя включва Llama 4 Scout, Llama 4 Maverick и Llama 4 Behemoth. Всички те са обучени на „големи количества немаркирани текстови, графични и видео данни“, за да получат „широко визуално разбиране“, казват от компанията пред TechCrunch.

Успехът на отворените модели от китайската лаборатория за изкуствен интелект DeepSeek, които имат сходно представяне с предишните водещи модели Llama на Meta, е бил катализатор за бързата разработка на новата AI платформа. Твърди се, че Meta е сформирала екипи, на които е била възложена задачата да разгадаят как DeepSeek е намалила разходите за работа и внедряване на модели като R1 и V3.

Scout и Maverick са свободно достъпни на Llama.com и от партньорите на Meta, включително платформата за разработване на изкуствен интелект Hugging Face, докато Behemoth все още е в процес на обучение. Meta казва, че Meta AI, нейният асистент с изкуствен интелект в приложения, включително WhatsApp, Messenger и Instagram, е актуализиран, за да използва Llama 4 в 40 държави. Мултимодалните функции засега са ограничени до САЩ на английски език.

На потребителите и компаниите с „местоживеене“ или с „основно място на стопанска дейност“ в ЕС е забранено да използват или разпространяват моделите, което вероятно е резултат от законодателството на блока. В миналото Meta е обявявала тези закони за прекалено обременяващи. Освен това, както и при предишните издания на Llama, компаниите с повече от 700 милиона активни месечни потребители трябва да поискат специален лиценз от Meta, който може да предостави или откаже по свое усмотрение.

„Тези модели Llama 4 поставят началото на нова ера за екосистемата Llama“, пише Meta в публикация в блога си. „Това е само началото на колекцията“.

Meta казва, че Llama 4 е първата ѝ кохорта от модели, която използва MoE (mixture of experts) aрхитектура, която е по-ефективна от гледна точка на изчисленията за обучение и отговаряне на заявки. Нейното предимствое, че разделя задачите за обработка на данни на подзадачи и след това ги делегира на по-малки, специализирани „експертни“ модели.

Според вътрешните тестове на Meta Maverick, който според компанията е най-добър за случаи на употреба на „общ асистент и чат“, превъзхожда модели като GPT-4o на OpenAI и Gemini 2.0 на Google при определени показатели за кодиране, разсъждаване, многоезичност, дълъг контекст и изображения. Въпреки това Maverick не може да се мери с по-способни скорошни модели като Gemini 2.5 Pro на Google, Claude 3.7 Sonnet на Anthropic и GPT-4.5 на OpenAI.

Силните страни на Scout са в задачи като обобщаване на документи и разсъждения върху големи бази данни. Уникалното при него е, че има много голям контекстен прозорец. Казано на разбираем език, Scout може да приема изображения и до милиони думи, което му позволява да обработва и работи с изключително дълги документи.

Scout може да работи с един графичен процесор Nvidia H100, докато Maverick изисква система Nvidia H100 DGX или еквивалентна технология, според изчисленията на Meta.

Все още непубликуваният Behemoth на Meta ще се нуждае от още по-мощен хардуер. Вътрешните сравнителни анализи на компанията показват, че Behemoth превъзхожда GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Pro (но не и 2.5 Pro) при няколко оценки, измерващи STEM умения като решаване на математически задачи.

Интересно е, че Meta твърди, че е настроила всички свои модели Llama 4 така, че да отказват по-рядко да отговарят на „спорни“ въпроси. Според компанията Llama 4 отговаря на „дискусионни“ политически и социални теми, на които предишните модели не биха отговорили. Освен това компанията твърди, че Llama 4 е „драстично по-балансирана“ по отношение на това кои въпроси категорично няма да приеме.