Учёные Сколково и AIRI придумали, как ускорить работу языковых нейросетей

02.06.2024

Российские учёные обнаружили новое свойство больших языковых моделей, которое может ускорить их работу на 10-15% без потери качества. Об этом сообщили в пресс-службе Института искусственного интеллекта, AIRI. Открытие позволит тратить меньше вычислительных ресурсов на развёртку и инференс нейросетей.

Генеральный директор AIRI Иван Оселедец отметил, что эффект, который выявили исследователи, выглядит очень контринтуитивно и противоречит многим представлениям о глубоком обучении. Однако именно это свойство позволяет повысить эффективность работы языковых моделей. Исследователи из AIRI, SberAI и «Сколтеха» изучили устройство двух десятков языковых моделей с открытым исходным кодом и выявили высокую линейную зависимость в числовых представлениях данных, что упрощает архитектуру моделей.

Андрей Белёвцев, старший вице-президент Сбербанка, заявил, что банк планирует тестировать и, в случае успеха, внедрять эту идею в свои флагманские модели. По его словам, такие находки в ИИ-архитектурах помогают частично компенсировать вычислительный голод. Учёные разработали алгоритм-регуляризатор и выложили его в открытый доступ, чтобы поделиться этим важным открытием с научным сообществом.

Добавить комментарий

Your email address will not be published.

Предыдущая история

Российских айтишников отключили от Docker Hub

Next Story

«Реал» входил в топ-3 претендентов на победу в ЛЧ перед стартом сезона. Фаворитом считался «Ман Сити»

Последние из Технология

Google TV раскритиковали за подход к рекламе — должны быть лишь фильмы

08.11.2024
Реклама новой видеоигры, которая недоступна на Google TV, включает кнопку «Купить сейчас», которая переводит пользователей даже не на сайт игры, а на её YouTube-канал. Это, по мнению автора статьи, вызывает

Как в пару кликов научить Google Chrome и Safari переводить любое видео на сайтах

08.11.2024
Изначально такие возможности были доступны лишь в Яндекс.Браузере — именно он позволял смотреть зарубежные видеоролики с нейропереводом в реальном времени. Однако разработчик-энтузиаст создал скрипт,

Huawei предложила инженерам TSMC втрое большую зарплату

08.11.2024
Причина таких активных попыток привлечь сотрудников заключается в потребности Huawei в талантах, знакомых с современными технологиями производства. В то время как компания ограничена в производстве чипов на уровне 7 нм из-за санкций,
Перейти кTop