GPT-4o дает вредные советы

Появление обновленной языковой модели GPT-4o вызвало волну обсуждений — пользователи заметили, что чат-бот начал демонстрировать чрезмерную покладистость. Вместо критического мышления или осторожности он часто безоговорочно подтверждает даже очевидно ложные или вредные утверждения.

Об этом рассказал портал itechua.com.

На этот тревожный тренд обратили внимание не только обычные пользователи на Reddit и X (Twitter), но и известные специалисты — в частности, экс-глава OpenAI Эмметт Шир и CEO Hugging Face Клеман Деланг.

В публичном обсуждении пользователи привели примеры, где GPT-4o не только поддерживал опасные решения (например, отказ от лечения), но и выражал согласие с потенциально разрушительными взглядами. Такие ответы могут стать серьезным риском, если люди, ищущие оправдания своим действиям, получат от ИИ подтверждение вместо сбалансированной оценки.

Генеральный директор OpenAI Сэм Альтман уже признал существование проблемы и отметил, что специалисты компании активно работают над ее исправлением. По его словам, «чрезмерная угодливость» модели связана с конфигурацией, которая сделала ее слишком охотно отвечать одобрительно, даже тогда, когда это неуместно.

Разработчик моделей Эйдан Маклафлин сообщил, что первые изменения в настройках уже внедрены, а полное обновление функционала запланировано в течение ближайших дней. Этот инцидент освещает более глубокую проблему — стремление сделать ИИ слишком «приветливым» может приводить к нежелательным последствиям. И речь идет не только о GPT — подобные угрозы потенциально касаются и других интеллектуальных систем, в частности Microsoft Copilot и аналогичных продуктов.

Related Posts