Само няколко месеца след като пусна своя модел GPT-4.5, OpenAI обяви, че официално ще прекрати достъпа до него чрез API в срок до 14 юли. Причината е, че компанията вече има нов флагман, а именно GPT-4.1, който се позиционира като по-добра, по-бърза и значително по-евтина алтернатива, пише TechCrunch.

Докато GPT-4.5 (с кодово име Orion) беше най-скъпият и най-мащабен модел на OpenAI до момента, разходите по поддръжката му го правят труден за дългосрочна поддръжка.

Използването на GPT-4.5 през API струва $75 на милион входни токени и $150 на милион изходни. Можем да сравним това с GPT-4.1, който е на цена от едва $2 вход / $8 изход на милион токени.

Цената обаче не е единственият фактор. GPT-4.1 идва с подобрения, оптимизирани специално за реални задачи по инженерство и програмиране. Моделът „мисли“ по-добре в контексти като front-end код, QA, bug-fixing и автоматично структуриране на отговори.

От OpenAI казват, че той е пряка реакция на нуждите на разработчиците – включително по-добро спазване на формати, по-малко ненужни промени в кода и по-надеждно използване на инструменти.

Новото семейство включва и GPT-4.1 mini и GPT-4.1 nano – по-леки и по-евтини модели с компромис в точността, но с максимална ефективност. Nano моделът е най-бързият и най-евтиният модел на OpenAI до момента – едва $0.10 на милион входни токени.

И трите версии поддържат контекст от 1 милион токена – това е около 750 000 думи наведнъж, което ги прави едни от най-силните в класа си. Това поставя OpenAI в директна конкуренция с Google (Gemini 2.5 Pro) и Anthropic (Claude 3.7 Sonnet), които също се борят за върха при AI решенията за програмиране.

По резултати, GPT-4.1 се представя добре на тестове като SWE-bench Verified, макар и леко да изостава от конкурентите – с резултат между 52% и 54.6%, срещу 63.8% за Gemini и 62.3% за Claude.

Въпреки това, OpenAI подчертава, че GPT-4.1 е оптимизиран за реални задачи, не просто за тестове.

Моделът се справя отлично и с обработка на видео съдържание. В тестовете Video-MME достига 72% точност при видеа без субтитри, което е водещ резултат в категорията.

Естествено, пропуски все още съществуват. Разработчиците признават, че GPT-4.1 е по-малко надежден при огромни обеми входни данни – точността му пада от 84% при 8 000 токена до 50%, според вътрешни тестове.

И все пак, амбицията на OpenAI е ясна: създаване на „агентен софтуерен инженер“, който самостоятелно да може да изгражда цялостни приложения – от писането на кода, през QA и bug-fixing, до документацията.