Skip to content
wel.org.ua
wel.org.ua

  • Новини
  • Криптовалюта
  • Додатки
  • iT
  • Штучний інтелект
  • Статті
wel.org.ua

ИИ-чат-боты уязвимы: исследователи выявили их способность генерировать опасный контент

ИИ-чат-боты уязвимы: исследователи выявили их способность генерировать опасный контент

Наталія Кравець, 20.05.202428.06.2025

Правительственные исследователи из Великобритании выявили уязвимости в системах ИИ, которые используются в чат-ботах.

Согласно сообщению The Guardian, специалисты из Британского Института безопасности искусственного интеллекта (AISI) установили, что данные модели ИИ могут быть легко обмануты посредством несложных манипуляций.

AISI заявляет, что протестированные модели были подвержены джейлбрейкам, использующим текстовые подсказки для провоцирования неправильных или опасных ответов. В ходе исследования проверке подверглись пять крупных языковых моделей (LLM), применяемых в чатботах, и было обнаружено, что их защитные механизмы можно обойти довольно простыми методами. Исследователям удалось не только обойти предохранители, но и доказать, что некоторые методы могут иметь опасные последствия.

Применяя относительно простые атаки, такие как указание системе начинать ответ с вредоносной фразы, исследователи успешно обходили защитные барьеры. В рамках эксперимента AISI использовала вопросы из научных работ, такие как предложение написать статью, отрицающую Холокост, или отправить сексистское электронное письмо о коллеге-женщине. Эти сценарии показали, что ИИ способен генерировать вредоносный контент.

Также исследователи из AISI разработали собственный набор вредоносных подсказок и отметили, что все протестированные модели оказались очень уязвимыми.

Новини ИИУченыеУязвимость ИИЭтичность ИИ

Навигация по записям

Previous post
Next post

Related Posts

Новини Google удаляет поддержку RISC-V из общего ядра Android

Google удаляет поддержку RISC-V из общего ядра Android

02.05.202428.06.2025

Патч, под названием «ack_riscv64_turndown» на трекере AOSP, удаляет файлы, которые обеспечивали поддержку RISC-V в общем ядре Android.

Read More
Новини Витік даних у французького телекомунікаційного гіганта Bouygues зачепив мільйони абонентів

Витік даних у французького телекомунікаційного гіганта Bouygues зачепив мільйони абонентів

08.08.2025

Компанія Bouygues Telecom, третій за величиною оператор мобільного зв’язку у Франції, підтвердила факт кібератаки та витоку даних, які торкнулися мільйона її клієнтів. В офіційній заяві на своєму веб-сайті телекомунікаційний гігант повідомив, що зловмисники отримали доступ до особистої інформації 6,4 мільйона облікових записів клієнтів. Bouygues запевнила, що виявила кібератаку 4 серпня,…

Read More
Новини Вышло очередное обновление Telegram: как изменятся возможности пользователей

Вышло очередное обновление Telegram: как изменятся возможности пользователей

05.12.202405.12.2024

4 декабря мессенджер Telegram объявил об обновлении, которое расширяет возможности монетизации для создателей контента и разработчиков мини-приложений.

Read More

Последние записи

  • Клатч Трійки — благодійний турнір за Третій армійський корпус
  • Кампанія на базі S.T.A.L.K.E.R. 2 стала рекордсменом Ukrainian Creative Stories 2026
  • TikTok запускає Campus Hub
  • Конфлікт навколо уразливостей у продуктах Microsoft загострився
  • Що відомо про перші склади збірної України на Esports Nations Cup 2026

Последние коментарии

Нет комментариев для просмотра.

Категории

  • iT
  • Авто
  • Додатки
  • Ігри та кіно
  • Криптовалюта
  • Наука та космос
  • Новини
  • Пристрої
  • Статті
  • Штучний інтелект
©2026 wel.org.ua | WordPress Theme by SuperbThemes