5494ace86c4da3596d407f77170df4a9d17e4e5c THE ASHGABAT TIMES

Учёные МГУ нашли новый подход к организации записи конференций

08.05.2024

Учёные из МГУ, при поддержке НОШ «Мозг, когнитивные системы, искусственный интеллект», разработали новый метод, который эффективно решает две важные задачи: определение спикеров на аудиозаписях и их активности. Этот подход хорошо работает даже при потоковой обработке и перекрытии речи.

Диаризация спикеров — это процесс определения, кто и когда говорит на аудиозаписи. Это важно для многих приложений, включая транскрибирование речи и анализ эмоций. Новый метод эффективен и универсален, способен работать в различных условиях, включая шум и перекрытие речи.

Исследователи МГУ создали метод, который преодолевает ограничения существующих подходов. Он показывает превосходное качество даже в сценариях с перекрытием речи и может применяться в режиме реального времени, что открывает новые перспективы для различных приложений, включая распознавание речи и системы наблюдения.

Добавить комментарий

Your email address will not be published.

f817e8f3a21d5ea7072b29f446715814d70a4397 THE ASHGABAT TIMES
Предыдущая история

Эксперт рассказала, что такое нанопластик и опасен ли он для здоровья

890ea96e4c7135fba9e9d00b35c29b32dd535c15 THE ASHGABAT TIMES
Next Story

В России начнут производить микроконтроллеры для шифрования данных

Последние из Технология

В Microsoft Edge появился блокировщик программ-пугалок

30.01.2025
Новый блокировщик «пугалок» в Edge использует машинное обучение для обнаружения и блокировки. В настоящее время эта функция доступна для тестирования в предварительной версии браузера. Хотя часто пользователи могут

Британцы вслед за американцами «испугались» популярности DeepSeek

30.01.2025
Несмотря на «наличие лучших университетов и опыта в различных отраслях», Великобритания «с трудом поспевает за глобальными конкурентами в области ИИ». Система финансирования в Великобритании медленная и раздробленная, и зачастую предпочтение отдается небольшим, постепенным улучшениям,

Alibaba воспользовалась хайпом вокруг DeepSeek и выпустила свою новейшую ИИ-модель

30.01.2025
Qwen2.5-VL, продвинутая визуально-языковая модель, может анализировать изображения, графики и видео длительностью более часа. Она также может определять точные моменты в видео и превращать отсканированные документы в структурированные данные.
Перейти кTop