ea0e2f999d9b7b77746a916f864b59c196b9d9b3 THE ASHGABAT TIMES

В «Яндексе» разработают нейросеть, способную понимать и голос и текст

04.06.2024

«Яндекс» занялся разработкой новой нейросетевой модели под названием SpeechGPT, хотя компания пока официально не объявила об этом. Эта модель, как сообщается, будет мультимодальной, что означает, что она способна обрабатывать и текстовую, и звуковую информацию, а также выполнять разные задачи, связанные с текстом и звуком.

Представители «Яндекса» пояснили, что они уже работают над мультимодальностью в своих сервисах, таких как ассистент «Алиса», однако они не дали ответа на вопрос о модели SpeechGPT. Некоторые сервисы «Яндекса» уже умеют обрабатывать данные разного типа: например, ассистент «Алиса» позволяет общаться голосом и текстом, а в сервисе Yandex SpeechSense появилась возможность анализировать текстовые сообщения.

Однако эксперты отмечают, что есть разница между мультимодальным пользовательским опытом и самой мультимодальностью модели. В отличие от мультимодальных моделей, такие как GPT-4o, от OpenAI, которые могут работать сразу с разными видами контента без задержек, текущие подходы часто требуют перевода данных из одного формата в другой, что занимает больше времени.

Добавить комментарий

Your email address will not be published.

feb3f03202f5b22ca96607609c362f224633f1ca THE ASHGABAT TIMES
Предыдущая история

Эксперт рассказал, зачем браузерам знать вашу геолокацию

773447afabbcd49b2669984546c3d1efa4875198 THE ASHGABAT TIMES
Next Story

Тренер объяснил, что лучше для похудения: беговая дорожка или тренажёр-лестница

Последние из Технология

Индия потребовала от Volkswagen $1,4 млрд налогов

20.02.2025
Индийские налоговые органы потребовали от Volkswagen уплаты налогов за 12 лет, утверждая, что компания использует стратегию разделения импорта автомобилей, чтобы уменьшить выплаты налогов. Адвокат
Перейти кTop