OpenAI, активуючи свій браузер ChatGPT Atlas, змушений визнати, що загрози, пов’язані з атакою типу prompt injection, є постійним викликом. Цей вид атаки, який маніпулює штучними інтелектами, заважає безпечному функціонуванню таких агентів у відкритому веб-просторі.
У недавньому блозі компанія повідомила, що prompt injection, як і багато інших шахрайських методів в інтернеті, навряд чи коли-небудь буде повністю усунуто. Вони зазначили, що так звана «режим-агент» у ChatGPT Atlas створює додаткові ризики для безпеки.
ChatGPT Atlas
Atlas, який було запущено в жовтні, вже зазнав атак реномованих дослідників безпеки. Вони продемонстрували можливість змінювати поведінку браузера лише за допомогою кількох слів у Google Docs. Подібні проблеми існують також у інших AI-браузерах, таких як Comet від Perplexity.
У свою чергу, Національний центр кібербезпеки Великобританії нещодавно попередив, що атаки типу prompt injection можуть ніколи не бути повністю усунені, і запропонував професіоналам у сфері кібербезпеки переосмислити підходи до мінімізації ризиків, оскільки повне зупинення атак виглядає маловірогідним.
OpenAI розглядає prompt injection як тривалу проблему безпеки, тому компанія активно працює над посиленням оборони. Одним із інноваційних підходів є створення автоматизованого бота, навченої за допомогою підкріплення, який імітує роль хакера, намагаючись знайти способи вставлення злочинних інструкцій у системи AI. Цей бот здатен тестувати атаки в симуляції, що може допомогти OpenAI швидше виявляти вразливості.
Одним із прикладів уявного сценарію, продемонстрованого OpenAI, стало ненавмисне виконання шкідливих інструкцій у відповідь на електронну пошту. Після оновлення безпеки «режим-агент» зміг виявити спробу атаки та попередити користувача.
OpenAI наголосив на важливості широкомасштабного тестування та швидкого реагування на потенційні загрози, хоча представники компанії уникають конкретних коментарів щодо фактичних успіхів у зменшенні успішних атак. Рамі Маккарті, провідний дослідник безпеки в Wiz, зазначив, що навчання за допомогою підкріплення – це лише один із багатьох засобів боротьби зі зловмисниками.
Хоча OpenAI пропонує обмежити доступи та запровадити конкретні інструкції для агентів, ризики, пов’язані з використанням інструментів, залишаються досить високими. Зокрема, доступ до чутливої інформації може бути небезпечним, якщо не дотримуватися необхідних заходів обережності.
Таким чином, питання безпеки AI-браузерів, таких як ChatGPT Atlas, залишається вкрай актуальним. В умовах еволюції загроз, баланс між функціональністю та безпекою стає дедалі складнішим.