Край на GPT-4.5 в API – OpenAI преминава към новия си, по-ефективен модел GPT-4.1
Компанията изтегля най-скъпия си модел от API и залага на по-достъпна и по-бърза алтернатива, оптимизирана за реални задачи в програмирането и софтуерното инженерство
&format=webp)
Само няколко месеца след като пусна своя модел GPT-4.5, OpenAI обяви, че официално ще прекрати достъпа до него чрез API в срок до 14 юли. Причината е, че компанията вече има нов флагман, а именно GPT-4.1, който се позиционира като по-добра, по-бърза и значително по-евтина алтернатива, пише TechCrunch.
Докато GPT-4.5 (с кодово име Orion) беше най-скъпият и най-мащабен модел на OpenAI до момента, разходите по поддръжката му го правят труден за дългосрочна поддръжка.
Използването на GPT-4.5 през API струва $75 на милион входни токени и $150 на милион изходни. Можем да сравним това с GPT-4.1, който е на цена от едва $2 вход / $8 изход на милион токени.
Цената обаче не е единственият фактор. GPT-4.1 идва с подобрения, оптимизирани специално за реални задачи по инженерство и програмиране. Моделът „мисли“ по-добре в контексти като front-end код, QA, bug-fixing и автоматично структуриране на отговори.
От OpenAI казват, че той е пряка реакция на нуждите на разработчиците – включително по-добро спазване на формати, по-малко ненужни промени в кода и по-надеждно използване на инструменти.
Новото семейство включва и GPT-4.1 mini и GPT-4.1 nano – по-леки и по-евтини модели с компромис в точността, но с максимална ефективност. Nano моделът е най-бързият и най-евтиният модел на OpenAI до момента – едва $0.10 на милион входни токени.
И трите версии поддържат контекст от 1 милион токена – това е около 750 000 думи наведнъж, което ги прави едни от най-силните в класа си. Това поставя OpenAI в директна конкуренция с Google (Gemini 2.5 Pro) и Anthropic (Claude 3.7 Sonnet), които също се борят за върха при AI решенията за програмиране.
По резултати, GPT-4.1 се представя добре на тестове като SWE-bench Verified, макар и леко да изостава от конкурентите – с резултат между 52% и 54.6%, срещу 63.8% за Gemini и 62.3% за Claude.
Въпреки това, OpenAI подчертава, че GPT-4.1 е оптимизиран за реални задачи, не просто за тестове.
Моделът се справя отлично и с обработка на видео съдържание. В тестовете Video-MME достига 72% точност при видеа без субтитри, което е водещ резултат в категорията.
Естествено, пропуски все още съществуват. Разработчиците признават, че GPT-4.1 е по-малко надежден при огромни обеми входни данни – точността му пада от 84% при 8 000 токена до 50%, според вътрешни тестове.
И все пак, амбицията на OpenAI е ясна: създаване на „агентен софтуерен инженер“, който самостоятелно да може да изгражда цялостни приложения – от писането на кода, през QA и bug-fixing, до документацията.