Фильтруй это: новая технология удаляет окружающий шум избирательно
Шум стал неотъемлемой частью нашей жизни. Мы постоянно слышим различные звуки, которые могут мешать нам сосредоточиться, расслабиться или просто наслаждаться тишиной. Поэтому многие люди используют шумоподавляющие наушники, которые позволяют заблокировать нежелательные звуки и погрузиться в свой собственный мир музыки или подкастов.
В то же время иногда мы хотим слышать не только то, что воспроизводится в наших наушниках, но и определенные звуки из окружающей среды, которые могут быть важными, интересными или приятными для нас. Как же выбрать, какие звуки мы будем слышать, а какие нет?
Ответ на этот вопрос может дать новая технология, разработанная учеными из Университета Вашингтона, которая называется «семантическим слухом». Эта технология использует глубокое обучение, чтобы распознавать и фильтровать определенные звуки в реальном времени, позволяя пользователю настраивать свои наушники в соответствии с его предпочтениями.
Система «семантического слуха» состоит из двух основных компонентов: шумоподавляющих наушников и смартфона, подключенного к ним по беспроводной связи. Наушники захватывают аудиосигнал из окружающей среды с помощью встроенных микрофонов, которые обычно используются для подавления шума, и передают его на смартфон, где запущено специальное приложение.
Приложение анализирует аудиосигнал с помощью нейронной сети, которая была обучена распознавать 20 различных звуковых классов, таких как сирены, плач младенцев, речь, пылесосы и щебет птиц. Пользователь может выбрать, какие звуки он хочет слышать, а какие нет, либо через интерфейс приложения, либо с помощью голосовых команд. Приложение затем возвращает на наушники только выбранные звуки, эффективно блокируя все остальные шумы.
Система «семантического слуха» имеет ряд преимуществ перед традиционными шумоподавляющими наушниками. Она позволяет пользователю контролировать, какие звуки он хочет слышать, а не просто блокировать все или ничего. Это может быть полезно для безопасности, комфорта и удовольствия пользователя. Например, пользователь может хотеть слышать сирену скорой помощи, чтобы уступить ей дорогу, но не хочет слышать гудки машин или разговоры прохожих. Или не пропустить плач ребенка, но не слышать при этом шум телевизора или посудомоечной машины. Система позволяет пользователю выбирать, какие звуки он хочет слышать, в зависимости от ситуации и настроения.
Плюс, система «семантического слуха» сохраняет пространственные ориентиры, то есть способность определять направление и расстояние до источника звука. Это достигается за счет того, что наушники захватывают аудиосигнал с двух сторон головы пользователя, а приложение обрабатывает его с учетом разницы во времени и громкости между левым и правым каналами. Таким образом, пользователь может не только слышать выбранные звуки, но и определять, откуда они исходят.
Прямо сейчас система не идеальна и имеет определенные ограничения. Одна из проблем заключается в том, что некоторые звуки могут быть слишком похожи друг на друга, чтобы их можно было легко отличить. Это может привести к тому, что алгоритм пропустит или ошибочно включит нежелательные звуки в аудиопоток пользователя. Например, если пользователь хочет слышать только речь, но в фоне играет вокальная музыка, система может не справиться с разделением этих звуков и воспроизвести их оба. Или если пользователь хочет слышать только плач своего ребенка, но в фоне есть другие детские голоса, система может не отличить их и воспроизвести их все.
Разработчики, признают эту проблему и работают над ее устранением. Они считают, что одним из способов улучшить точность и качество системы является использование более реалистичных и разнообразных данных для обучения нейронной сети, которая распознает звуки. В настоящее время они используют набор данных, называемый AudioSet, который содержит более двух миллионов видеоклипов из YouTube, размеченных по 632 звуковым классам.
Однако этот набор данных может быть недостаточно представительным для всех возможных сценариев использования алгоритма, так как он не учитывает различия в качестве, громкости, окружении и контексте звуков. Поэтому исследователи планируют собрать и использовать более специализированные и персонализированные данные, которые будут соответствовать потребностям и предпочтениям конкретных пользователей. Также они планируют расширить количество звуковых классов, которые система может распознавать и фильтровать, чтобы увеличить ее функциональность и гибкость.
В то же время иногда мы хотим слышать не только то, что воспроизводится в наших наушниках, но и определенные звуки из окружающей среды, которые могут быть важными, интересными или приятными для нас. Как же выбрать, какие звуки мы будем слышать, а какие нет?
Ответ на этот вопрос может дать новая технология, разработанная учеными из Университета Вашингтона, которая называется «семантическим слухом». Эта технология использует глубокое обучение, чтобы распознавать и фильтровать определенные звуки в реальном времени, позволяя пользователю настраивать свои наушники в соответствии с его предпочтениями.
Система «семантического слуха» состоит из двух основных компонентов: шумоподавляющих наушников и смартфона, подключенного к ним по беспроводной связи. Наушники захватывают аудиосигнал из окружающей среды с помощью встроенных микрофонов, которые обычно используются для подавления шума, и передают его на смартфон, где запущено специальное приложение.
Приложение анализирует аудиосигнал с помощью нейронной сети, которая была обучена распознавать 20 различных звуковых классов, таких как сирены, плач младенцев, речь, пылесосы и щебет птиц. Пользователь может выбрать, какие звуки он хочет слышать, а какие нет, либо через интерфейс приложения, либо с помощью голосовых команд. Приложение затем возвращает на наушники только выбранные звуки, эффективно блокируя все остальные шумы.
Система «семантического слуха» имеет ряд преимуществ перед традиционными шумоподавляющими наушниками. Она позволяет пользователю контролировать, какие звуки он хочет слышать, а не просто блокировать все или ничего. Это может быть полезно для безопасности, комфорта и удовольствия пользователя. Например, пользователь может хотеть слышать сирену скорой помощи, чтобы уступить ей дорогу, но не хочет слышать гудки машин или разговоры прохожих. Или не пропустить плач ребенка, но не слышать при этом шум телевизора или посудомоечной машины. Система позволяет пользователю выбирать, какие звуки он хочет слышать, в зависимости от ситуации и настроения.
Плюс, система «семантического слуха» сохраняет пространственные ориентиры, то есть способность определять направление и расстояние до источника звука. Это достигается за счет того, что наушники захватывают аудиосигнал с двух сторон головы пользователя, а приложение обрабатывает его с учетом разницы во времени и громкости между левым и правым каналами. Таким образом, пользователь может не только слышать выбранные звуки, но и определять, откуда они исходят.
Прямо сейчас система не идеальна и имеет определенные ограничения. Одна из проблем заключается в том, что некоторые звуки могут быть слишком похожи друг на друга, чтобы их можно было легко отличить. Это может привести к тому, что алгоритм пропустит или ошибочно включит нежелательные звуки в аудиопоток пользователя. Например, если пользователь хочет слышать только речь, но в фоне играет вокальная музыка, система может не справиться с разделением этих звуков и воспроизвести их оба. Или если пользователь хочет слышать только плач своего ребенка, но в фоне есть другие детские голоса, система может не отличить их и воспроизвести их все.
Разработчики, признают эту проблему и работают над ее устранением. Они считают, что одним из способов улучшить точность и качество системы является использование более реалистичных и разнообразных данных для обучения нейронной сети, которая распознает звуки. В настоящее время они используют набор данных, называемый AudioSet, который содержит более двух миллионов видеоклипов из YouTube, размеченных по 632 звуковым классам.
Однако этот набор данных может быть недостаточно представительным для всех возможных сценариев использования алгоритма, так как он не учитывает различия в качестве, громкости, окружении и контексте звуков. Поэтому исследователи планируют собрать и использовать более специализированные и персонализированные данные, которые будут соответствовать потребностям и предпочтениям конкретных пользователей. Также они планируют расширить количество звуковых классов, которые система может распознавать и фильтровать, чтобы увеличить ее функциональность и гибкость.
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Раскрыта главная тайна антарктического льда: ученые узнали, как и кем была взломана природная защита Шестого континента
Похоже, той Антарктиде, которую мы знаем, приходит конец. Впрочем, это не точно...
Древнеримский артефакт переписывает историю Америки: Колумб был не первым?
Почему находка из индейской могилы почти 100 лет вызывает ожесточенные споры среди археологов и историков?...
Еще раз об убийстве Андрея Боголюбского: что рассказали кости погибшего князя?
Профессор судебной медицины поправил историков и выявил неточности древних летописей...
Тайна гибели сибирского «Титаника»: почему некоторые детали катастрофы 1921 года неизвестны даже сейчас?
Поразительно, но тогда судьи единогласно оправдали капитана парохода. Так кто же тогда был виновником этого страшного происшествия?...
Японец 26 лет ждал, пока раскроют убийство его жены. Часть 2. Расплата
Как наука отменила срок давности у преступления? И какая тайна осталась не раскрытой?...
Японец 26 лет ждал, пока раскроют убийство его жены
Как новейшие технологии помогли сдвинуть с места нераскрываемое дело...
Жители Анд переписали свою ДНК: почему горные индейцы пьют ядовитую воду, но чувствуют себя при этом хорошо?
По словам ученых, эволюция сделала красивый и хитрый ход. И это не иммунитет к токсинам, а нечто другое, более интересное...
Главный секрет человеческого дыхания: ученые рассказали, почему мы дышим «вахтовым методом»
Эксперты предупреждают: из-за особенности организма многие люди не смогут попасть в космос. Но решение все-таки есть...
Ядерный взрыв на Луне: для чего советские ученые хотели провести такой грандиозный эксперимент?
Зачем России атомный реактор на Луне и как он поможет нам добраться до Венеры?...
Почему эти меры не спасут Антарктиду: пять проектов по спасению ледников оказались провалом
Эксперт жестко проанализировал самые популярные программы по сохранению льда на Шестом континенте. Увы, они оказались невыполнимой фантастикой, причем опасно...
ФСБ рассекретило часть архивов Александра Вадиса, генерала «Смерш»: как советская контрразведка переиграла немцев на Курской дуге. И не только
Историки говорят: по биографии этого смершевца можно запросто снять несколько остросюжетных боевиков...