Обратный звонок Заказать
8 (4932) 26-26-04

ТРЦ Серебрянный Город / 3-й уровень
рядом А-113

Ремонт Вашей техники высококвалифицированными специалистами на профессиональном оборудовании в максимально сжатые сроки
  • Работаем более 8 лет
  • 90 000 успешных ремонтов
  • Собственный склад запчастей
  • Превосходное обслуживание

Голосовые помощники поймут команду и на фоне шума

Опубликовано: Июнь 23, 2017

Категории: Полезные статьи

Виртуальные ассистенты производства различных компаний беспрестанно соревнуются в точности выполнения данных им команд. Что касается быстроты и правильности реакции, здесь они действительно показывают значительный рост. То же самое можно сказать о качестве распознавания речи, однако виртуальные ассистенты пока не сильны в выделении нужной информации из общего шума. Способ преодоления самого сложного аспекта этой проблемы разработали в Mitsubishi Electric Corporation.

Если искусственный интеллект уже достиг неплохих результатов в «понимании» команд на фоне природных звуков или звуков улицы, то с выделением одного голоса из многих дела обстояли совсем неважно. Благодаря инженерам японской корпорации программа «научилась» различать речь одного человека среди нескольких говорящих. Принцип действия технологии, названной Deep Clustering, заключается в дроблении звукового потока на составные части и последующего анализа каждой из них. Искусственный интеллект обучается прямо в процессе работы, поэтому применять такой способ можно не прибегая к помощи дополнительных микрофонов.

В ходе испытаний, организованных Mitsubishi Electric, программа сумела распознать предложение, которое два человека одновременно произносили на различных языках. Длительность задержки при этом не превышала трех секунд, а точность восприятия составила 90 %. Когда число говорящих выросло до трех, ИИ справился с неплохим результатом – 80 %.

Новая технология способна на порядок повысить уровень работы голосовых помощников. Правильность реакции вырастет при сохранении единственного микрофона, что придется очень кстати в носимых устройствах или встраиваемых системах.различать голос