GPT-4 става мързелив и глупав: Охладете очакванията си, съветват учени

Изкуственият интелект може да се "учи" и да става все по-интелигентен с течение на времето.

Това беше една от основните причини за световната мания по приложението ChatGPT веднага след пускането на модела от OpenAI миналия ноември.

Ами ако не се случва така в действителност?

Точно от това се оплакват напоследък потребителите на GPT-4, най-мощния модел на изкуствен интелект в света.

В коментари в Twitter и във форума на разработчиците на OpenAI, те сигнализират за редица проблеми с производителността, съобщава BusinessInsider.

Сред основните проблеми са отслабена логика, повече грешни отговори, загуба на информация, проблеми със следването на инструкции, забравяне да се добавят скоби в основния софтуерен код и запомняне само на последните задачи.

В будна кома ли е GPT-4

"GPT-4 е разочароващ", пише разработчик, който използва технологията, за да кодира функции за своя уебсайт.

"Това е като да караш Ферари в продължение на един месец, а после изведнъж да се превърнеш в изтърбушен стар пикап. Не съм сигурен, че искам да плащам за него.", допълва потребителят.

Питър Янг, продуктов мениджър в Roblox, пише, че моделът генерира по-бързи резултати, но с по-лошо качество. "Установих, че е станал и по-мързелив", отговоря му друг потребител на Twitter, Фрейзър Маклауд.

Потребителят Кристи Кенеди пише във форума за разработчици на OpenAI, че GPT-4 зацикля отново и отново при извеждането на код и друга информация.

"Това е мозъчна смърт в сравнение с преди. Ако всъщност не го притискате да се държи както преди, може и да не забележите. И все пак, ако наистина искате да го ползвате пълноценно, ще видите, че очевидно е много по-глупав", оплаква се тя.

"Не, не сме направили GPT-4 по-глупав. Точно обратното: правим всяка нова версия по-интелигентна от предишната". Това написа в Twitter Питър Уелиндър, вицепрезидент по продуктите в OpenAI, след като Insider съобщи за проблемите. "Ако имате примери, в които смятате, че е регресирала, моля, отговорете на тази тема и ние ще разследваме", добави той.

No, we haven't made GPT-4 dumber. Quite the opposite: we make each new version smarter than the previous one.

Current hypothesis: When you use it more heavily, you start noticing issues you didn't see before.
— Peter Welinder (@npew) July 13, 2023

След многобройните оплаквания от потребители, изследователи на изкуствения интелект решават да разберат какво се случва с технологията и изготвят ново проучване.

Резултатите

"Установихме, че представянето на GPT-3.5 и GPT-4 се различават значително при тези две версии и че поведението им при някои задачи се влошава значително с течение на времето", заявяват авторите.

В екипа присъстват сериозни изследователи на изкуствения интелект. Основният от тях е Матей Захария, главен технически директор на Databricks, една от най-добрите компании за данни с изкуствен интелект, която наскоро беше оценена на 38 млрд. долара.

"Интересен е и въпросът дали услугата за LLM като GPT-4 постоянно става "по-добра" с течение на времето", пишат в статията си Захария и колегите му изследователи.

ChatGPT е навсякъде, но откъде идва? Историята на една технологияОсновите на технологията на големите езикови модели са поставени още през 80-те години на миналия век

Магията LLM

Магията на тази технология се състои в това, че може да поглъща нови данни и да ги използва, за да се усъвършенства с течение на времето, без да се налага софтуерни инженери ръчно да актуализират кода.

Това е основната идея, която движи днешната лудост по AI и съпътстващите я скокове на фондовите пазари. Ако обаче GPT-4 се влошава, този аргумент започва да отслабва за почитателите на изкуствения интелект, се казва в доклада.

Това е огромна промяна в сравнение с началото на тази година, когато OpenAI развълнува света с ChatGPT, а технологичната индустрия очакваше пускането на GPT-4 с трепет.

Първоначално ChatGPT работеше с GPT-3 и GPT-3.5 - са гигантските базови модели на изкуствения интелект, които осигуряват неговите странни отговори.

По-големият GPT-4 беше пуснат през март и бързо се превърна в модела, който се използва от разработчиците и други специалисти от технологичната индустрия. Той се смята за най-мощния наличен модел на AI и е мултимодален, което означава, че разбира изображения и текстови данни.

С течение на времето, GPT-4 стана по-бърз, но производителността забележимо намаля, което установява и новият доклад на учените.

ChatGPT За обучението на GPT-3 Microsoft може да е консумирал невероятните 700 000 литра вода

Факторът Microsoft

Microsoft е инвестирала значителни средства в OpenAI. Компанията внедрява тази технология в своя софтуер и таксува потребителите за новите възможности.

Във вторник – същият ден, в който беше публикувано проучването, Microsoft представи цени за Microsoft CoPilot – нови версии на популярни облачни софтуери, като Office 365, които работят с изкуствен интелект. Това струва 30 долара на месец повече, в допълнение към това, което потребителите вече плащат.

Пазарната стойност на технологичния лидер скочи с над 150 млрд. долара след това съобщение, което показва, че Уолстрийт залага на изкуствения интелект и на въздействието, което ще окаже върху продуктите на компанията.

Здравословен скептизицъм

Новото проучване за възможностите на GPT-4 предоставя здравословна доза скептицизъм относно прогнозите, които са в основата на тези диви колебания в стойността.

Според учения Гари Маркъс LLM моделите са толкова нестабилни, че да се разчита на тях за бизнес продукти от висок клас съвсем не е добра идея.

"Кой със здрав разум би разчитал на система, която може да бъде 97,6% правилна по дадена задача през март и 2,4% правилна по същата задача през юни?", написа той в Twitter, цитирайки един от изводите в научния труд. "Важни резултати. Нека, всички, които планират да разчитат на LLM, да им обърнат внимание.", съветва ученият.

Нещо повече, той прогнозира, че "тази нестабилност ще бъде гибелта на LLM".

"Те никога няма да бъдат толкова успешни в търговско отношение, колкото си представя общността на рисковите инвеститори и някоя архитектурна иновация, която позволява по-голяма стабилност, до голяма степен ще измести LLM в рамките на следващите 10 години.", допълни той.

Сподели Сподели Сподели Сподели