В «Яндексе» разработают нейросеть, способную понимать и голос и текст

04.06.2024

«Яндекс» занялся разработкой новой нейросетевой модели под названием SpeechGPT, хотя компания пока официально не объявила об этом. Эта модель, как сообщается, будет мультимодальной, что означает, что она способна обрабатывать и текстовую, и звуковую информацию, а также выполнять разные задачи, связанные с текстом и звуком.

Представители «Яндекса» пояснили, что они уже работают над мультимодальностью в своих сервисах, таких как ассистент «Алиса», однако они не дали ответа на вопрос о модели SpeechGPT. Некоторые сервисы «Яндекса» уже умеют обрабатывать данные разного типа: например, ассистент «Алиса» позволяет общаться голосом и текстом, а в сервисе Yandex SpeechSense появилась возможность анализировать текстовые сообщения.

Однако эксперты отмечают, что есть разница между мультимодальным пользовательским опытом и самой мультимодальностью модели. В отличие от мультимодальных моделей, такие как GPT-4o, от OpenAI, которые могут работать сразу с разными видами контента без задержек, текущие подходы часто требуют перевода данных из одного формата в другой, что занимает больше времени.

Добавить комментарий

Your email address will not be published.

Предыдущая история

Эксперт рассказал, зачем браузерам знать вашу геолокацию

Next Story

Тренер объяснил, что лучше для похудения: беговая дорожка или тренажёр-лестница

Последние из Технология

Эксперт объяснил, смогут ли когда-нибудь смартфоны передавать запахи

21.09.2024
Запахи, по словам Цзяня Лю, доцента кафедры электротехники и компьютерных наук из Университета Теннесси, создаются молекулами, которые летают в воздухе и достигают вашего носа. Затем нос посылает сигналы в мозг,

Ученые разработали новый метод доставки лекарств с помощью экзосом

21.09.2024
Исследования показали, что экзосомы, обладающие отличной биосовместимостью и способностью к точечному нацеливанию, могут значительно улучшить доставку siRNA. Ученые обнаружили, что увеличение содержания холестерина в мембране экзосом способствует

Новый алгоритм NASA предскажет стихийные бедствия

21.09.2024
Nested Fusion позволяет визуализировать сложные данные, что особенно полезно для ученых из различных областей, включая химию, биологию и геологию. Метод объединяет наборы данных с разными разрешениями, создавая

Исследование: мозг контролирует ходьбу только при сильной дискоординации

21.09.2024
Ученые провели эксперименты с участниками, которые ходили на беговой дорожке, подвергающейся внезапным изменениям скорости. Это вызывало временную утрату нормального ритма, но участники быстро восстанавливали координацию движений. Для
Перейти кTop