Изкуственият интелект се разви изключително бързо в рамките на кратко време. Сякаш на Земята се разби извънземен космически кораб и изведнъж човечеството получи достъп до напреднали технологии.

Генеративният изкуствен интелект (GenAI), с инструменти като ChatGPT, удари света силно в началото на 2023 г. Само година по-късно много доставчици вече включваха технологията в своите продукти и работните процеси се промениха драстично.

Как това се случи толкова бързо и по същество трансформира цялата индустрия на информационните технологии за една нощ? Какво направи възможно това развитие?

ZDNET разглежда десет ключови фактора, които допринасят за изключително бързия напредък на GenAI и приемането му в технологичните стекове и работните процеси. Те са разделени в две основни фази.

Фаза I: Фундаментални иновации

Изследователите работят с AI от десетилетия. Но доскоро възможностите на технологията бяха невероятно ограничени в сравнение с това, което ChatGPT може да прави днес.

През това десетилетие настъпи ерата на фундаменталните иновации в областта на AI, които го направиха способен както да решава специфични проблеми и да работи в много тесни области, така и да се използва широко. В тази фаза има три ключови фактора.

1. Напредък в трансформиращите модели

Въпреки че AI се изследва и използва от десетилетия, през по-голямата част от това време той има някои сериозни ограничения. Повечето модели трябваше да бъдат предварително обучени със специфични материали, за да се създаде експертна компетентност. Те също така използваха невронни мрежи, които обработваха думите една по една, а това ги затрудняваше да разберат смисловата разлика на дадена дума от гледна точка на контекста.

Но през 2017 г. Google публикува документ, наречен „Вниманието е всичко, от което се нуждаете“. В него компанията предлага модел, който позволява на AI да се фокусира върху това, което определя като важни думи. Така технологията започва да обработва цели изречения и мисли наведнъж. Тази „трансформация на механизмите на вниманието“ позволява на AI да разбират контекста.

2. Широкообхватно обучени фундаментални модели

Този подход дава на изследователите начин да обучават AI върху големи обеми от информация и да определят контекста от нея. Това означава, че моделите могат да се мащабират, за да се обучават на почти всичко, и позволява на модели като GPT-3.5 и GPT-4 на OpenAI да работят с бази от знания, които обхващат практически целия интернет и огромни колекции от печатни книги и материали. По този начин те стават почти безкрайно адаптивни и способни да черпят от огромни масиви информация от реалния свят. Това означава, че AI вече могат да се използват за почти всяко приложение, а не за такива, специално създадени за решаване на отделни проблеми.

В основен проблем се превръща въпросът кой притежава всички тези данни за обучение. В момента се водят многобройни съдебни дела срещу доставчиците на изкуствен интелект за обучение (и използване) на данни от източници, защитени с авторски права.

Друг проблем, свързан с първия, е, че голяма част от тази информация не е проверена.

3. Пробиви в хардуера (GPU и TPU)

До началото на това десетилетие редица компании и изследователски екипи в световен мащаб разработват софтуерни системи, базирани на трансформационния модел и набори от данни за обучение. Но това изисква огромни изчислителни възможности.

Не става дума само за необходимостта да се извършват масово паралелни и матрични операции с висока скорост, но и за необходимостта това да се прави, като същевременно разходите за енергия и охлаждане се поддържат на практично ниво.

В началото се оказва, че геймърските графични процесори на NVIDIA са способни да извършват матричните операции, необходими на изкуствения интелект (рендирането в игрите също е силно матрично). Но след това компанията разработи своите чипове от сериите Ampere и Hopper, които значително подобриха както производителността, така и използването на енергия.

По подобен начин Google разработи своите TPU (Tensor Processing Units), които бяха специално проектирани за работа с AI. Microsoft и Amazon също разработиха персонализирани чипове (Maia и Graviton), които да им помогнат да изградят своите AI центрове за данни.

Тези пробиви подпомогнаха обучението на модели в световен мащаб и ги направиха достъпни, поне за най-големите играчи. А възможностите на AI могат да се продават чрез SaaS (software-as-a-service) модел, което разшири достъпа до тях за повечето предприятия.

Едновременно с това скоростта на обработка на AI нарасна бързо, което позволи да се анализират данни в реално време.

Фаза II: Пазарните сили стимулират приемането

След като вече има работеща технология, се появява друг въпрос: Какво да правим с нея?

Много пъти в историята се е случвало даден инженерен екип да създаде продукт или услуга, които е смятал за революционни, само за да се откаже от работата си заради липса на практичност или пазарно приемане. Но при GenAI пазарните сили са тези, които движат истинската промяна. За това има седем ключови фактора.

4. ChatGPT за всички и достъп до API

Тогава се появи ChatGPT. Името означава буквално програма за чат, която е генеративна, предварително обучена и използва технологията за трансформация. Но въпреки това обикновено име, в началото на 2023 г. платформата се превърна в най-бързо развиващото се приложение на всички времена.

OpenAI направи ChatGPT безплатна за всички. Разбира се, в безплатната версия имаше някои ограничения. Също така използването ѝ се оказа също толкова лесно, колкото и търсенето в Google. Всичко, което трябва да направите, е да отворите сайта и да въведете заявката си. А благодарение на нововъведенията от по-горе качеството на отговорите на ChatGPT е спиращ дъха. Всеки, който го изпробва, изведнъж осъзнава, че се докосва до бъдещето.

OpenAI отвори моделите на ChatGPT за други програмисти чрез API. Всичко, от което се нуждае един разработчик вече, е свободен уикенд и номер на кредитна карта, за да добави променящ света изкуствен интелект във всяко приложение. Това срути всички бариери пред навлизането на технологията.

5. Отвореният код

Макар че поддържаните от доставчиците приложни програмни интерфейси (API), като тези на OpenAI, могат значително да намалят времето за пускане на пазара, те също така могат да доведат до зависимост. За да се предотврати пълната такава от патентовани технологии, общността на отворения код прегърна AI в голяма степен.

Моделите с отворен код (LLaMa, Stable Diffusion, Falcon, Bloom, T5 и т.н.) предоставят непатентовани и самостоятелно хоствани възможности за AI, без да разчитат на големите технологични монополи. Отвореният код също така демократизира достъпа до AI, като позволи на разработчиците да създават решения в области извън предпазните огради, които големите доставчици на модели са длъжни да поддържат в действие. Платформи като Hugging Face например предоставят лесни за използване и тестване инструменти, които позволяват на разработчици с различни нива на умения бързо да интегрират AI в своите проекти.

Разбира се, налице са и класическите предимства на отворения код: широкомащабно сътрудничество, непрекъснати подобрения, оптимизации, генерирани и утвърдени от общността, и въвеждане на нови функции, включително някои твърде неясни, за да бъдат изгодни за голям доставчик, но необходими за определени проекти.

Всичко това позволи на предприятия от всякакъв мащаб, на изследователи и дори на разработчици, които работят по нощите и уикендите, да добавят AI в своите проекти. А това, от своя страна, ускорява внедряването на AI в широк спектър от приложения.

6. Търсене от страна на потребителите и предприятията

GenAI не е само реклама. Той работи и предоставя стойност. Употребите му варират от помощ при програмиране и отстраняване на грешки до обработката на снимки, анализ на настроения, създаване на движещи се обекти във видеоклипове, почистване на лошо аудио, писане на текстове и имейли и много други.

Затова малки и големи предприятия, както и студенти, журналисти и писатели - всички забелязаха, че GenAI може да им помогне наистина. Не само, че оценките на компаниите за AI скочиха до небето, но и потребителите действително купуват и използват AI инструментите, след като изведнъж станаха достъпни.

7. Популярност и мрежови ефекти

В продължение на години, дори десетилетия, AI беше далеч от масовото разпространение. Разбира се, имаше ограничени негови намеси във видеоигрите и бяха създадени експертни системи, които помагаха за решаването на конкретни проблеми за някои компании. Имаше и много обещания и изследвания. Но когато се стигаше до въпроса за възвръщаемост на инвестициите, такава често липсваше.

В рамките на няколко месеца обаче ChatGPT се превърна в най-бързо развиващото се приложение на всички времена, достигайки 100 милиона активни потребители. Година по-късно броят им се удвои до 200 милиона активни потребители. А това доведе след себе си и така нужната на инвеститорите възвръщаемост.

8. Конкуренция

Изведнъж изкуственият интелект се превърна в главна тема, а не в личностен белег на съседа маниак, когото каните да ви поправи компютъра, но бихте предпочели да си тръгне, след като той отново заработи. OpenAI изведнъж струваше милиарди и изглеждаше, че Google, Microsoft, Meta, Amazon, Apple и всички останали са останали назад.

Инвестициите и лицензионните сделки бяха навсякъде, а AI се включваше в основните продукти или като бонусна функция, или (което е много по-разпространено) като много приятно допълнение към месечния абонамент. Microsoft има Copilot, Google - Gemini, Meta - Meta AI, Amazon - Q, а Apple своята платформа Apple Intelligence.

9. Законодателно и регулаторно изоставане

Този бум на изкуствения интелект придоби и някои характеристики на Дивия запад. Правителствата все още се опитват да разберат какво представлява всичко това и дали е огромна икономическа възможност или екзистенциална заплаха. А технологията може да е и двете.

Правителството на САЩ създаде някои планове за надзор на AI, но те далеч не са изчерпателни, въпреки че доставчиците са категорични, че може да се случи катастрофа, ако технологията не бъде регулирана. Съдебните дела по въпроси, свързани с авторските права, усложниха нещата.

ЕС вече има своя AI Act, но и той обхваща само някои аспекти на AI, докато системите се развиват с всеки изминал ден. Това е чудесно за бързия растеж и иновациите, но също така означава, че технологията се движи без предпазни огради.

10. Непрекъснати иновации и инвестиции

Всички самоизпълняващи се пророчества, свързани с AI, подхранват нови иновации, защото те действително работят. Големите компании продължават не само да правят залози за милиарди долари на технологията, но и да предлагат убедителни продукти и услуги, които могат да осигурят реална стойност за техните клиенти.

Все повече компании и частни лица инвестират в стартиращи и вече работещи услуги в областта на изкуствения интелект. Виждаме пробиви като мултимодален AI с текст/изображения/видео/аудио, автономни агенти и дори AI, използвани за кодиране на AI.

Скоростите на предаване на данни станаха достатъчно бързи и достъпни, за да могат телефоните да бъдат винаги свързани с интернет, което помогна на много стартиращи компании да предлагат услуги с изключително ценни приложения. Затова и тези компании се разраснаха бързо, както и инвестициите в сектора.