В России создали универсальный фильтр для ИИ-моделей THE ASHGABAT TIMES

В пресс-службе MWS AI (входит в МТС Web Services) сообщили, что совместная разработка российских и южнокорейских исследователей может повысить безопасность использования больших языковых моделей. Новый фильтр проверяет запросы пользователей и ответы искусственного интеллекта (ИИ) на наличие вредоносных инструкций, токсичности и конфиденциальных данных.

Сейчас лишь 7% россиян используют корпоративные ИИ-решения, предпочитая публичные сервисы. Это создаёт риски утечки информации, особенно в медицине и госуправлении. Разработанный фильтр работает как промежуточное звено, анализируя входящие и исходящие данные. Администраторы могут настраивать правила проверки в зависимости от отраслевых стандартов и внутренних политик.

Тестирование на модели Grok-2 показало, что фильтр снизил успешность атак, когда пользователи пытались обойти запреты, с 78% до 14%. Токсичность ответов уменьшилась с 72% до 18%, а точность блокировки персональных данных достигла 95%.

Однако система увеличивает задержку ответа. При базовой защите она составляет 85 миллисекунд, а при подключении корпоративных баз данных — до 450 мс. Для большинства задач это приемлемо, но в высоконагруженных системах потребуется оптимизация.

Разработка совместима с любыми языковыми моделями и может применяться в бизнесе и государственных организациях.

PDF Button

111

Последние из Технология

Disney сотрудничает с OpenAI: инвестиции в размере $1 миллиарда и лицензирование персонажей для Sora

18.12.2025

Лос-Анджелес, декабрь 2025 года — Одна из ведущих мировых медиа- и киностудийных компаний Disney официально объявила о заключении соглашения о сотрудничестве с OpenAI. Согласно

Foxconn и OpenAI объединяют усилия для разработки дата-центров нового поколения

21.11.2025

Ключевой поставщик Nvidia — компания Foxconn — в пятницу объявила о начале партнёрства с OpenAI. Совместный проект предусматривает разработку и производство нескольких поколений стоек

ПРООН и Министерство связи Туркменистана открывают Международный форум стартапов 2025 в рамках конференции TurkmenTel–2025

14.11.2025

Ашхабад, 13 ноября 2025 г.: 13 ноября 2025 года Программа развития Организации Объединенных Наций (ПРООН) в Туркменистане совместно с Министерством связи Туркменистана успешно открыли

Как скучная Oracle снова стала модной

23.09.2025

Технологический гигант возвращается в игру благодаря ИИ и облачным решениям Oracle, ранее воспринимавшаяся как консервативная компания корпоративного ПО, сегодня вновь в центре внимания благодаря

Oracle получит контроль над алгоритмом TikTok в США

23.09.2025

Ключевой шаг в обеспечении цифровой безопасности После завершения сделки по продаже американского сегмента TikTok, корпорация Oracle получит контроль над алгоритмом рекомендаций платформы в США.

В России создали универсальный фильтр для ИИ-моделей

Baglanyşykly habarlar

В Приамурье поля начнут обрабатывать роботизированные тракторы

Центр для развития беспилотных технологий создало АО «ГЛОНАСС»

Активное курсирование беспилотных судов в России начнется в ближайшие пять лет

Добавить комментарий Отменить ответ

Цукерберг приврал: самообучающийся ИИ — это не то, о чём вы подумали

В России вдвое увеличили срок службы редуктора тракторов

Последние из Технология

Disney сотрудничает с OpenAI: инвестиции в размере $1 миллиарда и лицензирование персонажей для Sora

Foxconn и OpenAI объединяют усилия для разработки дата-центров нового поколения

ПРООН и Министерство связи Туркменистана открывают Международный форум стартапов 2025 в рамках конференции TurkmenTel–2025

Как скучная Oracle снова стала модной

Oracle получит контроль над алгоритмом TikTok в США

В России создали универсальный фильтр для ИИ-моделей

Baglanyşykly habarlar

Добавить комментарий Отменить ответ

Цукерберг приврал: самообучающийся ИИ — это не то, о чём вы подумали

В России вдвое увеличили срок службы редуктора тракторов

Последние из Технология

Don't Miss