6ec61f210d95235843058f58b4cb057db328a2df THE ASHGABAT TIMES

Учёные Сколково и AIRI придумали, как ускорить работу языковых нейросетей

02.06.2024

Российские учёные обнаружили новое свойство больших языковых моделей, которое может ускорить их работу на 10-15% без потери качества. Об этом сообщили в пресс-службе Института искусственного интеллекта, AIRI. Открытие позволит тратить меньше вычислительных ресурсов на развёртку и инференс нейросетей.

Генеральный директор AIRI Иван Оселедец отметил, что эффект, который выявили исследователи, выглядит очень контринтуитивно и противоречит многим представлениям о глубоком обучении. Однако именно это свойство позволяет повысить эффективность работы языковых моделей. Исследователи из AIRI, SberAI и «Сколтеха» изучили устройство двух десятков языковых моделей с открытым исходным кодом и выявили высокую линейную зависимость в числовых представлениях данных, что упрощает архитектуру моделей.

Андрей Белёвцев, старший вице-президент Сбербанка, заявил, что банк планирует тестировать и, в случае успеха, внедрять эту идею в свои флагманские модели. По его словам, такие находки в ИИ-архитектурах помогают частично компенсировать вычислительный голод. Учёные разработали алгоритм-регуляризатор и выложили его в открытый доступ, чтобы поделиться этим важным открытием с научным сообществом.

Добавить комментарий

Your email address will not be published.

1f78e4ed26598447e9bb91ebebd49b05b58c2227 THE ASHGABAT TIMES
Предыдущая история

Российских айтишников отключили от Docker Hub

d96076 no logo no text THE ASHGABAT TIMES
Next Story

«Реал» входил в топ-3 претендентов на победу в ЛЧ перед стартом сезона. Фаворитом считался «Ман Сити»

Последние из Технология

Индия потребовала от Volkswagen $1,4 млрд налогов

20.02.2025
Индийские налоговые органы потребовали от Volkswagen уплаты налогов за 12 лет, утверждая, что компания использует стратегию разделения импорта автомобилей, чтобы уменьшить выплаты налогов. Адвокат
Перейти кTop