Новое исследование для улучшения технологии распознавания речи

Новое исследование направлено на понимание того, как человеческий мозг слышит звук, чтобы помочь разработать улучшенные слуховые аппараты и системы автоматического распознавания речи.

Исследование, проводимое университетами Саутгемптона и Кембриджа, направлено на разработку физиологических алгоритмов, имитирующих то, как наш мозг слышит звук, для улучшения традиционных алгоритмов обработки сигналов.

Новизна исследования в том, что вместо того, чтобы смотреть на энергию сигнала ?? как делают сегодняшние искусственные устройства ?? вместо этого исследователи концентрируются на том, как мозг обрабатывает звуковую информацию.

Доктор Стефан Блик из Института исследований звука и вибрации Саутгемптонского университета пытается создать алгоритмы, основанные на нейронных реакциях, чтобы понять, как кодируется звук в мозгу. Когда исследователи лучше узнают, как кодируется звук, они смогут выбирать части, кодирующие речь, и те, которые кодируют нежелательный шум. После этого они смогут повторно синтезировать звук в слуховых аппаратах с пониженным уровнем шума, но с неизменным качеством, чтобы повысить разборчивость речи.

Сегодняшние системы улучшения речи могут уменьшить шум и повысить качество речи, но они не очень хороши для улучшения разборчивости речи, особенно в шумных ситуациях, когда пользователям приходится концентрироваться, чтобы выбрать один динамик. Около 10% населения Великобритании страдают нарушениями слуха, поэтому современные технологии обработки сигналов не позволяют предложить подходящую систему для повышения разборчивости речи.

Доктор Блик говорит: "Сегодня конечной целью сообщества обработки речевых сигналов по-прежнему является разработка систем улучшения речи, которые работают так же хорошо, как люди, в шумных ситуациях. Нормальный слух человеческий по-прежнему легко превосходит любую техническую систему ?? обработка звука в мозгу более успешна, чем обработка сигналов в силиконе. Система, которая работает так же хорошо, как человек, приведет к следующей революции в человеческом общении и принесет большую пользу людям с нарушениями слуха.

"Мое видение состоит в том, чтобы в ближайшие пять лет создать интеллектуальный усилитель речи, который сможет определять источники звука и повышать разборчивость речи. Это должно быть полезно в повседневных ситуациях для слабослышащих, а также для людей с нормальным слухом, чтобы в конечном итоге снизить стигму, которую сегодня имеют слуховые аппараты. Использование этого устройства в будущем для улучшения слуха должно быть таким же обычным явлением, как ношение очков сегодня, чтобы лучше видеть."

Доктор Блик получил финансирование от Google Research Award для проведения этого исследования с коллегой по ISVR доктором Мэтью Райтом и доктором Яном Винтером из отделения физиологии Кембриджского университета.