Наушники с шумоподавлением сегодня широко распространены, но ученые нашли способ вывести эти устройства на новый уровень — создав наушники, способные фокусироваться на одном внешнем источнике звука и блокировать все остальные шумы.
Технология, получившая название «Целевой речевой слух», использует искусственный интеллект (ИИ), чтобы позволить владельцу повернуться лицом к говорящему поблизости и — после задержки в пару секунд — зафиксироваться на его голосе. Это позволяет пользователю слышать только этот конкретный источник звука, сохраняя сигнал, даже если динамик перемещается или отворачивается.
Технология включает в себя небольшой компьютер, который можно встроить в пару имеющихся в продаже наушников и использовать сигналы встроенного в наушники микрофона для выбора и идентификации голоса говорящего. Подробности ученые изложили в статье, опубликованной 11 мая в журнале Proceedings of the CHI Conference on Human Factors in Computing Systems.
Связанный: «У него было бы естественное право причинять нам вред, чтобы защитить себя»: как люди могут плохо обращаться с ИИ прямо сейчас, даже не подозревая об этом
Ученые надеются, что эту технологию можно будет использовать в качестве вспомогательного средства для людей с нарушениями слуха, и в дальнейшем они работают над внедрением системы в коммерческие наушники-вкладыши и слуховые аппараты.
«Сейчас мы склонны думать об искусственном интеллекте как о веб-чат-ботах, которые отвечают на вопросы», — сказал ведущий автор исследования. Шьям Голлакота, профессор компьютерных наук и инженерии Вашингтонского университета. «В этом проекте мы разрабатываем искусственный интеллект для изменения слухового восприятия любого, кто носит наушники, с учетом его предпочтений. С помощью наших устройств вы теперь можете четко слышать одного говорящего, даже если вы находитесь в шумной обстановке, когда говорит много других людей», — Голлакота. говорится в заявлении.
Целевой речевой слух (TSH) является продолжением исследования, проведенного теми же учеными всмысловой слухВ прошлом году они создали приложение для смартфона на базе искусственного интеллекта, которое можно было подключить к наушникам, что позволяло владельцу выбирать прослушивание из списка предустановленных «классов», одновременно подавляя все остальные шумы. Например, владелец мог выбрать, слушать ли сирены, младенцев, речь или птиц — и наушники выделяли бы только эти шумы и блокировали все остальные.
Чтобы использовать TSH, пользователь смотрит прямо перед говорящим, чей голос он хочет услышать, а затем нажимает небольшую кнопку на наушниках, чтобы активировать систему при правильном расположении.
Когда голос говорящего поступает в микрофон, программное обеспечение машинного обучения «регистрирует» источник звука. Он допускает небольшую погрешность — в случае, если слушатель не находится прямо перпендикулярно говорящему — прежде чем он определит целевой голос и зарегистрирует голосовые шаблоны. Это позволяет ему фиксироваться на динамике независимо от громкости или направления, в котором он смотрит.
Когда говорящий продолжает говорить, это улучшает способность системы концентрироваться на звуке, поскольку алгоритм лучше определяет уникальные закономерности целевого звука с течением времени.
На данный момент TSH может зарегистрировать только один источник звука или один динамик в любой момент времени, и это менее успешно, если есть другой шум аналогичной громкости, исходящий с того же направления.
В идеальном мире ученые предоставили бы системе «чистый» аудиообразец для идентификации и регистрации, без какого-либо другого шума окружающей среды, который мог бы помешать процессу, говорится в статье. Но это не будет хорошо сочетаться с созданием практического устройства, поскольку получение чистого звука в реальных условиях является сложной задачей.