Във вторник Alibaba пусна следващото поколение на своите големи езикови модели (LLM) с отворен код - Qwen3. Експертите определят това като поредния пробив в процъфтяващото китайско пространство на изкуствения интелект с отворен код.

Според публикация в блога на китайския технологичен гигант Qwen3 обещава подобрения в разсъжденията, следването на инструкции, използването на инструменти и многоезичните задачи. В нея се твърди, че той е равностоен на други модели от най-висок клас, като R1 на DeepSeek, в няколко индустриални сравнителни теста. Серията включва осем варианта на LLM, които обхващат различни архитектури и размери, предлагайки на разработчиците гъвкавост при използването на Qwen за създаване на AI приложения за крайни устройства като мобилни телефони.

Qwen3 е и дебютът на Alibaba в така наречените „хибридни модели за разсъждение“, за които се казва, че съчетават традиционните възможности на LLM с „усъвършенствано, динамично разсъждение“. Според компанията той може безпроблемно да преминава между „режим на мислене“ за сложни задачи като кодиране и обикновен режим за по-бързи отговори с общо предназначение.

„Забележително е, че моделът Qwen3-235B-A22B MoE значително намалява разходите за разгръщане в сравнение с други съвременни модели, което затвърждава ангажимента на Alibaba за достъпен, високопроизводителен изкуствен интелект“, казват от Alibaba, цитирани от CNBC.

Новите модели вече са свободно достъпни за индивидуални потребители в платформи като Hugging Face и GitHub, както и в уеб интерфейса на Alibaba Cloud. Qwen3 се използва и за захранване на AI асистента на Alibaba - Quark.

Напредъкът на Китай в областта на AI

Анализатори акцентират пред CNBC, че Qwen3 представлява сериозно предизвикателство за колегите на Alibaba в Китай, както и за американските лидери в индустрията.

Вей Сун, главен анализатор на изкуствен интелект в Counterpoint Research, посочва, че серията Qwen3 е „значителен пробив - не само заради най-добрата в класа си производителност“, но и заради няколко характеристики, които сочат „потенциала за приложение на моделите“.

Сред тези характеристики са хибридният режим на мислене на Qwen3, многоезичната поддръжка на 119 езика и диалекта и наличието на отворен код. При този тип софтуери изходният код е свободно достъпен в интернет за възможни модификации и разпространение. В началото на тази година моделът R1 на DeepSeek разтърси света на изкуствения интелект и бързо се превърна в катализатор за китайското AI пространство и приемането на подхода с отворен код.

„Пускането от Alibaba на серията Qwen3 допълнително подчертава силните възможности на китайските лаборатории да разработват висококонкурентни, иновативни модели с отворен код, въпреки нарастващия натиск от затегнатия контрол върху износа от страна на САЩ“, казва Рей Уанг, базиран във Вашингтон анализатор, който се фокусира върху американско-китайската икономическа и технологична конкуренция.

Според Alibaba Qwen вече се е превърнал в една от най-широко разпространените в света серии от AI модели с отворен код с над 300 милиона изтегляния в световен мащаб и повече от 100 000 производни системи на Hugging Face.

Уанг казва, че това приемане може да продължи и с Qwen3, като добавя, че претенциите за производителност могат да го превърнат в най-добрия модел с отворен код в световен мащаб - макар и все още да изостава от най-съвременните модели в света като o3 и o4-mini на OpenAI.

Китайски конкуренти като Baidu също побързаха да пуснат нови модели на изкуствен интелект след появата на DeepSeek. Междувременно през февруари Reuters съобщи, че самата DeepSeek ускорява пускането на своя наследник на R1.

„В по-широкия контекст на надпреварата между САЩ и Китай в областта на изкуствения интелект разликата между американските и китайските лаборатории намаля - вероятно до няколко месеца, а някои твърдят, че дори само до седмици“, казва Уанг. „С последното издание на Qwen 3 и предстоящото пускане на DeepSeek R2 тази разлика ще продължи да се свива“.