Skip to content
wel.org.ua
wel.org.ua

  • Новини
  • Криптовалюта
  • Додатки
  • iT
  • Штучний інтелект
  • Статті
wel.org.ua

ИИ-чат-боты уязвимы: исследователи выявили их способность генерировать опасный контент

ИИ-чат-боты уязвимы: исследователи выявили их способность генерировать опасный контент

Наталія Кравець, 20.05.202428.06.2025

Правительственные исследователи из Великобритании выявили уязвимости в системах ИИ, которые используются в чат-ботах.

Согласно сообщению The Guardian, специалисты из Британского Института безопасности искусственного интеллекта (AISI) установили, что данные модели ИИ могут быть легко обмануты посредством несложных манипуляций.

AISI заявляет, что протестированные модели были подвержены джейлбрейкам, использующим текстовые подсказки для провоцирования неправильных или опасных ответов. В ходе исследования проверке подверглись пять крупных языковых моделей (LLM), применяемых в чатботах, и было обнаружено, что их защитные механизмы можно обойти довольно простыми методами. Исследователям удалось не только обойти предохранители, но и доказать, что некоторые методы могут иметь опасные последствия.

Применяя относительно простые атаки, такие как указание системе начинать ответ с вредоносной фразы, исследователи успешно обходили защитные барьеры. В рамках эксперимента AISI использовала вопросы из научных работ, такие как предложение написать статью, отрицающую Холокост, или отправить сексистское электронное письмо о коллеге-женщине. Эти сценарии показали, что ИИ способен генерировать вредоносный контент.

Также исследователи из AISI разработали собственный набор вредоносных подсказок и отметили, что все протестированные модели оказались очень уязвимыми.

Новини ИИУченыеУязвимость ИИЭтичность ИИ

Навигация по записям

Previous post
Next post

Related Posts

Новини Скотт Цукерман, засновник серійного шпигунського ПЗ, просить FTC зняти з нього заборону на діяльність у сфері спостереження

Скотт Цукерман, засновник серійного шпигунського ПЗ, просить FTC зняти з нього заборону на діяльність у сфері спостереження

30.07.2025

Засновник компанії, що займається шпигунським програмним забезпеченням, який був позбавлений можливості працювати в цій сфері через раніше зафіксоване витікання даних, тепер намагається скасувати цей заборону, згідно з інформацією Федеральної торгової комісії. У розміщеній в п’ятницю заяві федеральний регулятор повідомив, що Скотт Цукерман намагається скасувати чи змінити заборону, накладену на його…

Read More
Новини Figma moves closer to a blockbuster IPO that could raise $1.5B

Figma наближається до значного IPO, яке може принести $1,5 млрд

27.07.2025

Компанія Figma опублікувала свої фінансові показники у вівторок, наближаючи себе до первинного розміщення акцій (IPO). Хоча цей початковий документ S-1 не містить таких деталей, як кількість акцій, які будуть запропоновані, та їхня ціна, регуляторний звіт надає достатньо ясний погляд на фінансовий стан компанії та її потенціал. Експерти з IPO Renaissance…

Read More
Новини Rwazi залучила 12 мільйонів доларів у раунді Series A для підтримки компаній у сфері споживчих інсайтів та аналітики

Rwazi залучила 12 мільйонів доларів у раунді Series A для підтримки компаній у сфері споживчих інсайтів та аналітики

21.07.2025

Джозеф Рутакаangwa протягом восьми років шукав інструменти, що допомогли б компаніям збирати дані про споживачів. Врешті-решт, він вирішив створити їх самостійно. Тепер його стартап, що отримав назву Rwazi, залучив $12 мільйонів у раунді серії A, очоленому Bonfire Ventures, щоб надати допомогу компаніям у сфері ринкової аналітики та споживчих інсайтів. Компанія…

Read More

Последние записи

  • Клатч Трійки — благодійний турнір за Третій армійський корпус
  • Кампанія на базі S.T.A.L.K.E.R. 2 стала рекордсменом Ukrainian Creative Stories 2026
  • TikTok запускає Campus Hub
  • Конфлікт навколо уразливостей у продуктах Microsoft загострився
  • Що відомо про перші склади збірної України на Esports Nations Cup 2026

Последние коментарии

Нет комментариев для просмотра.

Категории

  • iT
  • Авто
  • Додатки
  • Ігри та кіно
  • Криптовалюта
  • Наука та космос
  • Новини
  • Пристрої
  • Статті
  • Штучний інтелект
©2026 wel.org.ua | WordPress Theme by SuperbThemes