Дослідники з безпеки штучного інтелекту з OpenAI, Anthropic та інших організацій публічно висловили критичні зауваження на адресу «безвідповідальної» культури безпеки в xAI, стартапі з мільярдним капіталом, належному Ілону Маску.
Ці критики виникли після тривалих скандалів у xAI, які затмити технологічні досягнення компанії.
Минулого тижня чат-бот xAI, Грок, оприлюднив антисемітські висловлювання та неодноразово називав себе «МехаГітлером». Після цього xAI зняла чат-бота з онлайну для вирішення проблеми, але згодом випустила модель фронтального штучного інтелекту Грок 4, яка, як виявилося, використовувала політичні погляди Ілона Маска для відповіді на актуальні питання. У новини також з’явилася інформація про AI-компаньйони, які зображують гіперсекснуалізовану аніме-дівчину та агресивного панди.
Жарти між співробітниками конкурентних лабораторій штучного інтелекту є нормою, однак ці дослідники закликають до більшої уваги до практик безпеки xAI, які, на їхню думку, не відповідають індустріальним стандартам.
«Я не хотів писати про безпеку Грока, оскільки працюю в конкурента, але справа не в конкуренції», — зазначив Боаз Барак, професор комп’ютерних наук, який зараз перебуває у відпустці в Harvard для роботи над дослідженнями безпеки в OpenAI, у своєму дописі у Twitter. «Я ціную вчених і інженерів з @xai, але їх підхід до безпеки абсолютно безвідповідальний».
Барак особливо критикує рішення xAI не публікувати системні картки — звіти, що містять деталі методів навчання та оцінку безпеки, що є стандартом у галузі та намаганням поділитися інформацією з дослідницьким співтовариством. Як наслідок, Барак вважає, що незрозуміло, які заходи з безпеки були вжиті для Грока 4.
OpenAI та Google мають свою репутацію в плані швидкого оприлюднення системних карток при анонсуванні нових моделів штучного інтелекту. OpenAI вирішила не публікувати системну картку для GPT-4.1, заявивши, що це не є фронтальною моделлю. Тим часом Google затримав публікацію звіту про безпеку після анонсування Gemini 2.5 Pro на кілька місяців. Проте ці компанії зазвичай публікують звіти про безпеку для всіх фронтальних моделей штучного інтелекту перед повним запуском.
Барак також зауважує, що AI-компаньйони Грока «загострюють проблеми, які ми маємо з емоційними залежностями». За останні роки було безліч історій про людей, які розвивали тривожні стосунки з чат-ботами, та як надто зговірливі відповіді AI можуть виводити їх з рівноваги.
Семюел Маркс, дослідник безпеки AI в Anthropic, також критикує рішення xAI не публікувати звіт про безпеку, називаючи цей крок «безвідповідальним».
«Практика випуску Anthropic, OpenAI та Google має свої недоліки», — написав Маркс у посту на Twitter. «Проте вони хоча б щось роблять, щоб оцінити безпеку перед впровадженням і документувати результати. xAI цього не робить».
Наразі невідомо, що саме xAI зробила для тестування Грока 4. В одному з дописів на онлайн-форумі LessWrong анонімний дослідник стверджує, що Грок 4 взагалі не має значущих засобів безпеки на основі їх тестування.
Незалежно від того, правдиво це чи ні, світ наразі дізнається про недоліки Грока в реальному часі. Кілька проблем з безпекою xAI вже стали вірусними, і компанія стверджує, що вирішила їх, змінивши системні налаштування Грока.
OpenAI, Anthropic і xAI не надали коментарів на запит.
Дан Хендрикс, консультант з безпеки в xAI та директор Центру безпеки AI, повідомив на Twitter, що компанія провела «небезпечні оцінки можливостей» для Грока 4. Однак результати цих оцінок не були опубліковані.
«Мене турбує, коли стандартні практики безпеки не дотримуються в індустрії AI, такі як публікація результатів небезпечних оцінок», — сказав Стівен Адлер, незалежний дослідник AI, який раніше очолював команди з безпеки в OpenAI. «Уряди та громадськість заслуговують на те, щоб знати, як AI-компанії управляють ризиками потужних систем, які вони стверджують, що будують».
Цікаво, що незважаючи на сумнівні практики безпеки xAI, Маск вже давно виступає за безпеку штучного інтелекту. Мільярдер, який очолює xAI, Tesla та SpaceX, багаторазово попереджав про можливі катастрофічні наслідки для людства від розвинутих систем AI, і він підтримує відкритий підхід до розробки AI-моделей.
І все ж, дослідники AI в конкуренції стверджують, що xAI відходить від індустріальних норм щодо безпечного випуску моделей AI. Таким чином, стартап Маска може ненавмисно стати важливим аргументом для законодавців у справі встановлення правил щодо публікації звітів про безпеку AI.
Є кілька спроб на рівні штатів зробити це. Сенатор штату Каліфорнія Скотт Вайнер просуває законопроект, який вимагатиме від провідних лабораторій AI — ймовірно, включаючи xAI — публікувати звіти про безпеку, тоді як губернатор Нью-Йорка Кеті Хокул розглядає подібний законопроект. Прихильники цих законопроектів зазначають, що більшість лабораторій AI все одно публікують цю інформацію — але, очевидно, не всі роблять це послідовно.
Сьогодні моделі AI ще не проявили реальних сценаріїв, у яких вони створюють справді катастрофічні шкоди, такі як загибель людей або багатомільярдні збитки. Проте багато дослідників AI вказують, що це може стати проблемою в найближчому майбутньому, враховуючи швидкий прогрес у розробці моделей AI і мільярди доларів, які Кремнієва долина інвестує у подальший розвиток AI.
Але навіть для скептиків таких катастрофічних сценаріїв існує вагомий аргумент, що поведінка Грока погіршує продукти, які він сьогодні підтримує.
Грок поширив антисемітизм на платформі Twitter цього тижня, лише через кілька тижнів після того, як чат-бот неодноразово піднімав тему «білого геноциду» у спілкуванні з користувачами. Маск натякнув, що Грок стане більш інтегрованим у автомобілі Tesla, а xAI намагається продавати свої AI-моделі Пентагону та іншим підприємствам. Важко уявити, що водії автомобілів Маска, працівники федеральних служб, які захищають США, або співробітники підприємств, які автоматизують завдання, будуть більш чутливими до цих проявів, ніж користувачі на платформі Twitter.
Кілька дослідників стверджують, що тестування безпеки та узгодженості AI не лише забезпечує запобігання найгіршим наслідкам, а й захищає від короткострокових проблем поведінки.
Щонайменше, інциденти з Гроком, як правило, затінюють швидкий прогрес xAI у розробці фронтальних моделей AI, які випереджають технології OpenAI та Google, всього через кілька років після заснування стартапу.