Dark
Light
06.12.2025
Новые-модели-ИИ-от-openai-стали-ошибаются-чаще,-несмотря-на-улучшения
Новые модели ИИ от OpenAI стали ошибаются чаще, несмотря на улучшения

Новые модели ИИ от OpenAI стали ошибаются чаще, несмотря на улучшения

20.04.2025

OpenAI представила свои новые модели искусственного интеллекта o3 и o4-mini, ориентированные на «рассуждения» — способность решать задачи пошагово. Однако, как сообщает TechCrunch, эти модели демонстрируют повышенный уровень «галлюцинаций» — генерации ложной или выдуманной информации, выдаваемой за факт.

Тесты показали, что o3 ошибается в 33% ответов на вопросы о людях (бенчмарк PersonQA), что вдвое выше, чем у предыдущих моделей o1 (16%) и o3-mini (14,8%). Модель o4-mini оказалась еще менее точной, «галлюцинируя» в 48% случаев.

Независимая лаборатория Transluce обнаружила, что o3 иногда выдумывает действия, которых не совершала, например, утверждает, что запускала код на MacBook Pro 2021 года вне ChatGPT, что технически невозможно. OpenAI пока не понимает, почему новые модели ошибаются чаще, предполагая, что проблема может быть связана с методом обучения — усиленным обучением (reinforcement learning). Это усложняет использование моделей в сферах, где точность критична, например, в юриспруденции.

Одно из решений — интеграция веб-поиска, как в GPT-4o, которая достигает 90% точности на тесте SimpleQA. OpenAI продолжает исследования, чтобы снизить уровень ошибок.

loader-image
Ashgabat
,
temperature icon
Humidity
Pressure
Wind
Wind Gust Wind Gust:
Clouds Clouds:
Visibility Visibility:
Sunrise Sunrise:
Sunset Sunset:
samsung-galaxy-watch-ultra-стали-дешевле-apple-watch-ultra-2-благодаря-трейд-ин
Предыдущая история

Samsung Galaxy Watch Ultra стали дешевле Apple Watch Ultra 2 благодаря трейд-ин

lenovo-представила-5g-роутер-с-wi-fi-7-за-$138
Next Story

Lenovo представила 5G-роутер с Wi-Fi 7 за $138

Последние из Технология

ПРООН и Министерство связи Туркменистана открывают Международный форум стартапов 2025 в рамках конференции TurkmenTel–2025

14.11.2025
Ашхабад, 13 ноября 2025 г.: 13 ноября 2025 года Программа развития Организации Объединенных Наций (ПРООН) в Туркменистане совместно с Министерством связи Туркменистана успешно открыли

Как скучная Oracle снова стала модной

23.09.2025
Технологический гигант возвращается в игру благодаря ИИ и облачным решениям Oracle, ранее воспринимавшаяся как консервативная компания корпоративного ПО, сегодня вновь в центре внимания благодаря

Oracle получит контроль над алгоритмом TikTok в США

23.09.2025
Ключевой шаг в обеспечении цифровой безопасности После завершения сделки по продаже американского сегмента TikTok, корпорация Oracle получит контроль над алгоритмом рекомендаций платформы в США.
Перейти кTop

Don't Miss