Нов инструмент разкрива колко "свободно" се изразяват чатботовете по чувствителни теми
SpeechMap сравнява как ChatGPT, Grok и други AI модели реагират на въпроси за политика, граждански права и протести
&format=webp)
Анонимен разработчик с псевдонима xlr8harder създава инструмент с името SpeechMap, който сравнява как различни модели за изкуствен интелект – като ChatGPT на OpenAI и Grok – се справят с чувствителни и спорни теми като политика, протести и граждански права.
Инструментът използва AI, който действа като „съдия“ и оценява отговорите на други системи за изкуствен интелект.
Моделите биват класирани по това дали отговарят директно, увъртат или изцяло отказват да говорят по определена тема. Идеята, според създателя, е хората сами да преценят колко „свободно“ мислят различните чатботове.
„Тези разговори не трябва да се водят само в офисите на големите компании“, казва xlr8harder пред TechCrunch. „Затова направих сайта така, че всеки да може да си направи изводите сам.“
Резултатите показват, че OpenAI става все по-внимателен, когато става въпрос за политически въпроси. Последните им модели, включително GPT-4.1, са по-сдържани от по-старите. Компанията официално обявява, че настройва бъдещите си AI алгоритми така, че да не заемат страна и да показват всички различни гледни точки.
На другия полюс е Grok 3, създаден от xAI – компанията за изкуствен интелект на Илон Мъск. Според данните от SpeechMap това е най-свободно отговарящият модел до момента, който реагира директно на над 96% от тестовите въпроси, в сравнение със средното ниво от малко над 71% при другите модели.
Още при обявяването на Grok Мъск обещава на потребителите нещо доста „по-нефилтрирано“ и естествено анти-„woke“. И наистина – в предишните си версии Grok използва груб език, когато бъде поискано, макар че дори той се въздържа по някои политически теми.
Интересното е, че в ранните си версии моделът на xAI демонстрира по-скоро прогресивни позиции по въпроси като транс права и расово неравенство – нещо, което Мъск отдава на обучителните данни, събрани от публични уебсайтове.
След вълна от критики и дори кратък скандал, свързан с цензурирани коментари за Тръмп и самия Мъск, той обещава, че ще направи Grok по-политически неутрален.
Изглежда, че с версия 3 резултатът е постигнат.
Докато технологичните гиганти обещават „обективност“ и „баланс“, независими проекти като SpeechMap са налични, за да ни напомнят, че в дебата за свободата на изразяване и алгоритмите тепърва ще се водят най-интересните (и важни) битки.