
Наушники с ИИ позволяют слушать одного человека в толпе, взглянув на него лишь раз
В Вашингтонском университете (UW) разработали систему искусственного интеллекта, которая позволяет пользователю в наушниках посмотреть на говорящего человека в течение трёх-пяти секунд, а затем слушать только его голос, даже на ходу среди толпы и без дополнительной настройки.
Доступные на рынке наушники с шумоподавлением очень хорошо зарекомендовали себя. Но возможность игнорировать определённые звуки и вычленять другие по-прежнему бросает вызов исследователям.
Разработанную в UW систему создатели называют TSH, от Target Speech Hearing, то есть целевое прослушивание речи. TSH игнорирует все посторонние звуки вокруг и воспроизводит только голос целевого говорящего в режиме реального времени.
Старший соавтор изобретения Шьям Голлакота отметил, что многие представляют ИИ в первую очередь как чат-бота, который отвечает на вопросы. Но при воплощении проекта с умными наушниками речь шла о таком ИИ, который изменяет слышимое пользователю в наушниках, как он того пожелает. С помощью новых устройств можно чётко слышать определенного говорящего среди других болтающих людей.
Чтобы воспользоваться TSH, человек в наушниках с микрофонами нажимает кнопку, направив голову в сторону говорящего. Затем звуковые волны от голоса собеседника должны достигать микрофонов на обеих сторонах гарнитуры одновременно. Погрешность при этом составляет 16 градусов. Наушники посылают сигнал на встроенный компьютер, где программное обеспечение с машинным обучением запоминает желаемые вокальные отличия (паттерны) говорящего. Система улавливает голос говорящего и продолжает воспроизводить его для слушателя, даже когда человек в наушниках и тот, кого слушают, перемещаются. Способность TSH фокусироваться на конкретном голосе в процессе улучшается, получая от говорящего всё больше и больше обучающих данных.
Изобретатели протестировали свою систему на 21 человеке, которые оценили чистоту голоса того, чью речь отслеживала TSH. И сказали, что она была примерно вдвое лучше по сравнению с «сырым», обычным звучанием.
Концепт основан на предыдущем исследовании тех же учёных, которое они назвали «семантический слух». Тот научный проект позволял людям в наушниках выбирать определённые типы предпочтительных для прослушивания звуков из окружающего шума, например, или пение птиц, или голоса людей.
Теперь система TSH может фиксироваться только на одном говорящем, при условии, что другой громкий голос не доносится с той же стороны. Видимо, если бы парочка в обнимку трещала наперебой, TSH бы запуталась. Но когда пользователь недоволен качеством звука, он может перезапустить выбор цели с помощью динамика, чтобы улучшить чёткость.
Теперь те же изобретатели займутся улучшением ИИ для как для наушников, так и для слуховых аппаратов.
Доступные на рынке наушники с шумоподавлением очень хорошо зарекомендовали себя. Но возможность игнорировать определённые звуки и вычленять другие по-прежнему бросает вызов исследователям.
Разработанную в UW систему создатели называют TSH, от Target Speech Hearing, то есть целевое прослушивание речи. TSH игнорирует все посторонние звуки вокруг и воспроизводит только голос целевого говорящего в режиме реального времени.
Старший соавтор изобретения Шьям Голлакота отметил, что многие представляют ИИ в первую очередь как чат-бота, который отвечает на вопросы. Но при воплощении проекта с умными наушниками речь шла о таком ИИ, который изменяет слышимое пользователю в наушниках, как он того пожелает. С помощью новых устройств можно чётко слышать определенного говорящего среди других болтающих людей.
Чтобы воспользоваться TSH, человек в наушниках с микрофонами нажимает кнопку, направив голову в сторону говорящего. Затем звуковые волны от голоса собеседника должны достигать микрофонов на обеих сторонах гарнитуры одновременно. Погрешность при этом составляет 16 градусов. Наушники посылают сигнал на встроенный компьютер, где программное обеспечение с машинным обучением запоминает желаемые вокальные отличия (паттерны) говорящего. Система улавливает голос говорящего и продолжает воспроизводить его для слушателя, даже когда человек в наушниках и тот, кого слушают, перемещаются. Способность TSH фокусироваться на конкретном голосе в процессе улучшается, получая от говорящего всё больше и больше обучающих данных.
Изобретатели протестировали свою систему на 21 человеке, которые оценили чистоту голоса того, чью речь отслеживала TSH. И сказали, что она была примерно вдвое лучше по сравнению с «сырым», обычным звучанием.
Концепт основан на предыдущем исследовании тех же учёных, которое они назвали «семантический слух». Тот научный проект позволял людям в наушниках выбирать определённые типы предпочтительных для прослушивания звуков из окружающего шума, например, или пение птиц, или голоса людей.
Теперь система TSH может фиксироваться только на одном говорящем, при условии, что другой громкий голос не доносится с той же стороны. Видимо, если бы парочка в обнимку трещала наперебой, TSH бы запуталась. Но когда пользователь недоволен качеством звука, он может перезапустить выбор цели с помощью динамика, чтобы улучшить чёткость.
Теперь те же изобретатели займутся улучшением ИИ для как для наушников, так и для слуховых аппаратов.
- Дмитрий Ладыгин
- youtu.be/ArGKgodEUSo
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас

Пес войны из вечной мерзлоты: российские ученые «воскресили» самого древнего спецназовца Сибири
Уникальная реконструкция Северо-Восточного федерального университета действительно потрясает!...

Сканирование «Титаника» раскрыло героические поступки на тонущем корабле
Появились сенсационные подробности последних часов гибнущего судна....

Аргентинские ученые предложили неожиданную разгадку тайны Антикитерского механизма
Возможно, он постоянно «зависал», как старый компьютер. Или был вообще… игрушкой....

Почему западные эксперты боятся российских спутников-призраков?
Собрали для вас информацию по новой секретной российской миссии....

В мозгах спецназовцев обнаружились скрытые аномалии
Новейшее исследование показало, что обычный МРТ вообще не видит некоторые травмы головы....

60 косаток разом напали на редкого кита у берегов Западной Австралии
Жестокость 40-минутной охоты ужаснула даже бывалых ученых....

Пока мир тонет в песках, эта пустыня стремительно зеленеет!
Ученые рассказали, почему Великая индийская пустыня стала на 38% зеленее всего за 20 лет....

В Австралии «поправили» гены ядовитых жаб и создали ненасытных каннибалов
Генетически модифицированная ага никогда не взрослеет....

В Индии растёт спрос на ноутбуки типа «Франкенштейн»
Индийская культура ремонта даёт новую жизнь «убитым» компьютерам....

Если бы не астероид, динозавры до сих пор жили бы на планете
Новое исследование показало, что древние ящеры не были обречены до глобальной катастрофы....

Общий наркоз стирает уникальность головного мозга
Открытие поможет выводить пациентов из комы....

Чужой бог в сердце Тикаля: Тайна алтаря, который хотели забыть
Археологи рассказали, почему майя стирали следы чужой цивилизации....

Археологи обнаружили в Египте 3400-летний затерянный город
Самое поразительное: он скрывался… под руинами древнегреческого некрополя....

Причина необъяснимых нападений морских львов на людей наконец-то раскрыта
Все дело в редком токсине, который заполонил прибрежные воды Калифорнии....

В 30 раз экономнее, в 50 раз быстрее — вычислительная электроника переходит… на свет
Фотонные чипы отправляют кремний на пенсию?...

Живые громоотводы: раскрыта тайна деревьев, которые заставили молнию работать на себя
Ученые говорят, что Dipteryx oleifera переиграли саму природу....