Dark
Light
06.12.2025
В России-создали-универсальный-фильтр-для-ИИ-моделей
В России создали универсальный фильтр для ИИ-моделей

В России создали универсальный фильтр для ИИ-моделей

08.08.2025

В пресс-службе MWS AI (входит в МТС Web Services) сообщили, что совместная разработка российских и южнокорейских исследователей может повысить безопасность использования больших языковых моделей. Новый фильтр проверяет запросы пользователей и ответы искусственного интеллекта (ИИ) на наличие вредоносных инструкций, токсичности и конфиденциальных данных.

Сейчас лишь 7% россиян используют корпоративные ИИ-решения, предпочитая публичные сервисы. Это создаёт риски утечки информации, особенно в медицине и госуправлении. Разработанный фильтр работает как промежуточное звено, анализируя входящие и исходящие данные. Администраторы могут настраивать правила проверки в зависимости от отраслевых стандартов и внутренних политик.

Тестирование на модели Grok-2 показало, что фильтр снизил успешность атак, когда пользователи пытались обойти запреты, с 78% до 14%. Токсичность ответов уменьшилась с 72% до 18%, а точность блокировки персональных данных достигла 95%.

Однако система увеличивает задержку ответа. При базовой защите она составляет 85 миллисекунд, а при подключении корпоративных баз данных — до 450 мс. Для большинства задач это приемлемо, но в высоконагруженных системах потребуется оптимизация.

Разработка совместима с любыми языковыми моделями и может применяться в бизнесе и государственных организациях.

loader-image
Ashgabat
,
temperature icon
Humidity
Pressure
Wind
Wind Gust Wind Gust:
Clouds Clouds:
Visibility Visibility:
Sunrise Sunrise:
Sunset Sunset:
Цукерберг-приврал:-самообучающийся-ИИ —-это-не то,-о чём-вы подумали
Предыдущая история

Цукерберг приврал: самообучающийся ИИ — это не то, о чём вы подумали

В России-вдвое-увеличили-срок-службы-редуктора-тракторов
Next Story

В России вдвое увеличили срок службы редуктора тракторов

Последние из Технология

ПРООН и Министерство связи Туркменистана открывают Международный форум стартапов 2025 в рамках конференции TurkmenTel–2025

14.11.2025
Ашхабад, 13 ноября 2025 г.: 13 ноября 2025 года Программа развития Организации Объединенных Наций (ПРООН) в Туркменистане совместно с Министерством связи Туркменистана успешно открыли

Как скучная Oracle снова стала модной

23.09.2025
Технологический гигант возвращается в игру благодаря ИИ и облачным решениям Oracle, ранее воспринимавшаяся как консервативная компания корпоративного ПО, сегодня вновь в центре внимания благодаря

Oracle получит контроль над алгоритмом TikTok в США

23.09.2025
Ключевой шаг в обеспечении цифровой безопасности После завершения сделки по продаже американского сегмента TikTok, корпорация Oracle получит контроль над алгоритмом рекомендаций платформы в США.
Перейти кTop

Don't Miss