openai-обнаружила-скрытые-«личности»-в ИИ-моделях,-влияющие-на их поведение
OpenAI обнаружила скрытые «личности» в ИИ-моделях, влияющие на их поведение

OpenAI обнаружила скрытые «личности» в ИИ-моделях, влияющие на их поведение

20.06.2025

Учёные из OpenAI нашли в искусственном интеллекте особенности, которые отвечают за разные «личности» модели — в том числе те, что вызывают нежелательное или токсичное поведение. Эти «личности» — внутренние сигналы в системе, которые влияют на ответы ИИ (начинает лгать или советовать вредные вещи, например).

Исследователи смогли управлять уровнем токсичности, меняя всего один параметр в модели. Это открытие поможет лучше понять, почему ИИ иногда ведёт себя неправильно, и как сделать его «безопаснее».

Подобные «личности» в ИИ похожи на работу мозга человека, где определённые нейроны связаны с настроением или поведением. Кроме токсичности, у модели есть и другие «личности», например, сарказм. Интересно, что неправильное поведение модели можно исправить, переобучив её на примерах безопасного кода — достаточно всего нескольких сотен примеров.

loader-image
Ashgabat
3:32 дп, Дек 7, 2025
temperature icon 4°C
туман
Humidity 81 %
Pressure 1022 mb
Wind 0 mph
Wind Gust Wind Gust: 0 mph
Clouds Clouds: 20%
Visibility Visibility: 0 km
Sunrise Sunrise: 8:09 am
Sunset Sunset: 5:47 pm
Позитивный-настрой-помогает-сохранить-память-после-50-лет,-показало-исследование
Предыдущая история

Позитивный настрой помогает сохранить память после 50 лет, показало исследование

В Петербурге-создадут-беспилотник-массой-до 750 кг-для-логистики
Next Story

В Петербурге создадут беспилотник массой до 750 кг для логистики

Последние из Технология

ПРООН и Министерство связи Туркменистана открывают Международный форум стартапов 2025 в рамках конференции TurkmenTel–2025

14.11.2025
Ашхабад, 13 ноября 2025 г.: 13 ноября 2025 года Программа развития Организации Объединенных Наций (ПРООН) в Туркменистане совместно с Министерством связи Туркменистана успешно открыли

Как скучная Oracle снова стала модной

23.09.2025
Технологический гигант возвращается в игру благодаря ИИ и облачным решениям Oracle, ранее воспринимавшаяся как консервативная компания корпоративного ПО, сегодня вновь в центре внимания благодаря

Oracle получит контроль над алгоритмом TikTok в США

23.09.2025
Ключевой шаг в обеспечении цифровой безопасности После завершения сделки по продаже американского сегмента TikTok, корпорация Oracle получит контроль над алгоритмом рекомендаций платформы в США.
Перейти кTop

Don't Miss