Dark
Light
06.12.2025
Новый-конкурс-по программированию-раскрыл-слабые-результаты ИИ
Новый конкурс по программированию раскрыл слабые результаты ИИ

Новый конкурс по программированию раскрыл слабые результаты ИИ

25.07.2025

Недавно завершился первый этап нового «ИИ-челленджа» по программированию — K Prize, организованного Databricks и сооснователем Perplexity Энди Конвински. Победителем стал бразильский инженер Эдуардо Роча де Андраде, который получил $ 50 000. Но удивило то, что он правильно решил лишь 7,5% заданий.

Конвински отметил, что целью конкурса было создать действительно сложный тест, чтобы проверить реальные возможности моделей. В отличие от других испытаний, K Prize использует новые данные с GitHub и не допускает подготовки моделей на конкретных задачах, что делает тест честным, но сложным.

Конвински даже обещал миллион долларов тому, кто создаст открытую модель с точностью выше 90% в этом тесте. Он подчёркнул, что пока ИИ далеки от обещанных ролей врачей или юристов, а даже в программировании модели пока показывают низкий результат.

loader-image
Ashgabat
,
temperature icon
Humidity
Pressure
Wind
Wind Gust Wind Gust:
Clouds Clouds:
Visibility Visibility:
Sunrise Sunrise:
Sunset Sunset:
Российские-учёные-упростили-производство-стекла-для-детекторов-частиц
Предыдущая история

Российские учёные упростили производство стекла для детекторов частиц

Шесть-правозащитных-организаций-подали-жалобу-на alphabet-в ЕС
Next Story

Шесть правозащитных организаций подали жалобу на Alphabet в ЕС

Последние из Технология

ПРООН и Министерство связи Туркменистана открывают Международный форум стартапов 2025 в рамках конференции TurkmenTel–2025

14.11.2025
Ашхабад, 13 ноября 2025 г.: 13 ноября 2025 года Программа развития Организации Объединенных Наций (ПРООН) в Туркменистане совместно с Министерством связи Туркменистана успешно открыли

Как скучная Oracle снова стала модной

23.09.2025
Технологический гигант возвращается в игру благодаря ИИ и облачным решениям Oracle, ранее воспринимавшаяся как консервативная компания корпоративного ПО, сегодня вновь в центре внимания благодаря

Oracle получит контроль над алгоритмом TikTok в США

23.09.2025
Ключевой шаг в обеспечении цифровой безопасности После завершения сделки по продаже американского сегмента TikTok, корпорация Oracle получит контроль над алгоритмом рекомендаций платформы в США.
Перейти кTop

Don't Miss