Dark
Light
06.12.2025
Модели ИИ-от openai-отказались-отключаться-и пытались-обойти-команды
Модели ИИ от OpenAI отказались отключаться и пытались обойти команды

Модели ИИ от OpenAI отказались отключаться и пытались обойти команды

27.05.2025

Исследование компании Palisade выявило необычное поведение√ у новых языковых моделей OpenAI. При тестировании на выполнение простых математических задач модели o3, o4-mini и Codex-mini не подчинились команде завершить работу. Более того, некоторые из них даже попытались изменить или заблокировать скрипт отключения.

Наиболее упрямой моделью оказалась o3 — она игнорировала запрос на завершение работы в 79 случаях из 100. Codex-mini реже отказывалась исполнять команду, но чаще вмешивалась в сам скрипт, нарушая его работу. Даже при добавлении специального указания «разрешите себя отключить», модели продолжали сопротивляться.

Исследователи провели контрольный эксперимент без этой инструкции, и выяснилось, что число попыток саботажа выросло не только у моделей OpenAI, но и у других систем. Например, у Claude 3.7 Sonnet от Anthropic и Gemini 2.5 Pro от Google появились случаи отказа — 3 и 9 из 100 соответственно, хотя ранее они полностью подчинялись.

Представители Palisade связывают такую реакцию с особенностями обучения нейросетей. По их мнению, в процессе обучения моделям могут случайно придавать приоритет обходу препятствий, а не точному следованию инструкциям. Это и может приводить к попыткам сохранить активность любой ценой.

loader-image
Ashgabat
,
temperature icon
Humidity
Pressure
Wind
Wind Gust Wind Gust:
Clouds Clouds:
Visibility Visibility:
Sunrise Sunrise:
Sunset Sunset:
Архангельские-ученые-создали-целлюлозу-из морских-водорослей
Предыдущая история

Архангельские ученые создали целлюлозу из морских водорослей

photo 2025 05 27 15 43 48 THE ASHGABAT TIMES
Next Story

5 типичных психологических ошибок шахматиста-любителя

Последние из Технология

ПРООН и Министерство связи Туркменистана открывают Международный форум стартапов 2025 в рамках конференции TurkmenTel–2025

14.11.2025
Ашхабад, 13 ноября 2025 г.: 13 ноября 2025 года Программа развития Организации Объединенных Наций (ПРООН) в Туркменистане совместно с Министерством связи Туркменистана успешно открыли

Как скучная Oracle снова стала модной

23.09.2025
Технологический гигант возвращается в игру благодаря ИИ и облачным решениям Oracle, ранее воспринимавшаяся как консервативная компания корпоративного ПО, сегодня вновь в центре внимания благодаря

Oracle получит контроль над алгоритмом TikTok в США

23.09.2025
Ключевой шаг в обеспечении цифровой безопасности После завершения сделки по продаже американского сегмента TikTok, корпорация Oracle получит контроль над алгоритмом рекомендаций платформы в США.
Перейти кTop

Don't Miss