Очки с искусственным интеллектом понимают беззвучную речь
Исследователи из Корнельского университета, штат Нью-Йорк, разработали интерфейс распознавания беззвучной речи, который использует акустическое зондирование и искусственный интеллект (ИИ) для непрерывного распознавания до 31 беззвучной команды.
Носимый интерфейс с низким энергопотреблением, получил название EchoSpeech («Эхо-речь»). Устройству требуется всего несколько минут для обучения пользователя, прежде чем оно распознает команды, и затем систему можно запускать на смартфоне.
— Руидонг Чжан, ведущий автор EchoSpeech, докторант кафедры информатики.
В своём нынешнем виде EchoSpeech можно также использовать для общения с другими людьми через смартфон в местах, где звучащая речь неудобна или неуместна, например, в шумном ресторане или тихой библиотеке. Интерфейс беззвучной речи также можно совместить со стилусом и использовать с программным обеспечением для проектирования, таким как CAD, чтобы обходиться без клавиатуры и мыши.
Оснащённые парой микрофонов и динамиков размером меньше карандашных ластиков, очки EchoSpeech превращаются в носимую гидроакустическую систему на базе ИИ, посылающую и принимающую звуковые волны на основе движений лица и рта в частности. Алгоритм глубокого обучения затем анализирует эти профили в режиме реального времени с точностью около 95%.
Чен Чжан, доцент кафедры информатики и директор лаборатории интеллектуальных компьютерных интерфейсов для будущих взаимодействий (SciFi) в Корнелле, пояснил, что для восприятия данных сонар направляют на говорящего. В итоге изобретение в виде очков получилось маленьким, экономичным, а также сохраняет конфиденциальность.
Большинство технологий распознавания беззвучной речи ограничены набором команд и требуют, чтобы пользователь смотрел на камеру или носил её, что непрактично и неосуществимо, добавил Чен Чжан. По его словам, существуют также серьёзные проблемы с конфиденциальностью, связанные с носимыми камерами — как для пользователя, так и для тех, с кем тот взаимодействует.
— Франсуа Гимбретьер, профессор информатики.
А поскольку данные обрабатываются локально на смартфоне, а не загружаются в облако, конфиденциальная информация не выходит из-под контроля.
Носимый интерфейс с низким энергопотреблением, получил название EchoSpeech («Эхо-речь»). Устройству требуется всего несколько минут для обучения пользователя, прежде чем оно распознает команды, и затем систему можно запускать на смартфоне.
Для людей, которые не могут озвучить речь, эта технология может стать отличным способом синтезировать слова. Это может вернуть пациентам их голоса
— Руидонг Чжан, ведущий автор EchoSpeech, докторант кафедры информатики.
В своём нынешнем виде EchoSpeech можно также использовать для общения с другими людьми через смартфон в местах, где звучащая речь неудобна или неуместна, например, в шумном ресторане или тихой библиотеке. Интерфейс беззвучной речи также можно совместить со стилусом и использовать с программным обеспечением для проектирования, таким как CAD, чтобы обходиться без клавиатуры и мыши.
Оснащённые парой микрофонов и динамиков размером меньше карандашных ластиков, очки EchoSpeech превращаются в носимую гидроакустическую систему на базе ИИ, посылающую и принимающую звуковые волны на основе движений лица и рта в частности. Алгоритм глубокого обучения затем анализирует эти профили в режиме реального времени с точностью около 95%.
Чен Чжан, доцент кафедры информатики и директор лаборатории интеллектуальных компьютерных интерфейсов для будущих взаимодействий (SciFi) в Корнелле, пояснил, что для восприятия данных сонар направляют на говорящего. В итоге изобретение в виде очков получилось маленьким, экономичным, а также сохраняет конфиденциальность.
Большинство технологий распознавания беззвучной речи ограничены набором команд и требуют, чтобы пользователь смотрел на камеру или носил её, что непрактично и неосуществимо, добавил Чен Чжан. По его словам, существуют также серьёзные проблемы с конфиденциальностью, связанные с носимыми камерами — как для пользователя, так и для тех, с кем тот взаимодействует.
Технология акустического восприятия EchoSpeech устраняет необходимость в видеокамерах. А поскольку аудиоданные намного меньше, чем изображения или видео, для их обработки требуется меньшая пропускная способность, и их можно передавать на смартфон через блютус в режиме реального времени
— Франсуа Гимбретьер, профессор информатики.
А поскольку данные обрабатываются локально на смартфоне, а не загружаются в облако, конфиденциальная информация не выходит из-под контроля.
- Дмитрий Ладыгин
- youtu.be/ZjucAwFqVqQ
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Собаки, живущие вблизи Чернобыльской АЭС, мутировали и приобрели новые сверхспособности
Ученые насчитали в ДНК псов-мутантов более 400 аномальных генов....
Почему найденную в Мексике пирамиду возрастом 1000 лет опять закопали
Подальше положишь — поближе возьмёшь....
Врачи говорят: свинец сделал Америку еще более безумной
Этилированное топливо вызвало 151 млн дополнительных психических расстройств в США....
Все, кому удалили этот «бесполезный» орган, могут внезапно умереть в ближайшие пять лет
Врачи в корне поменяли мнение по поводу вилочковой железы....
Открыт странный полупроводник, который потребляет в миллиард меньше энергии
Ученые совершенно случайно устранили нерешаемую проблему в хранении данных....
Рядом с людьми жили странные звери: волков приручали много раз
Но большинство попыток не увенчалось успехом....
Смертоносное комбо: робот RAVEN получил всё лучшее от птиц, дронов и самолётов
Спасатель, доставщик или орудие убийства — решать владельцу....
В Японии открыли революционный способ получения топлива из воды и солнечного света
Но, как всегда, дьявол скрывается в деталях....
Струя из черной дыры взорвала таинственный объект
Астрономы NASA находятся в полной растерянности....
Древние американцы питались… как саблезубые тигры
Ученые говорят: поглощали мясо мамонтов буквально тоннами....
Самая старая птица на планете готовится снова стать матерью
Самка альбатроса отложила яйцо… в 74 года. Между прочим, 60-е по счету....
Миниатюрные черные дыры могут находиться прямо на Земле и даже проникать в наши тела
Американские физики утверждают, что нашли доказательства этого феномена....
Странная груда черепов, найденная в Италии, поставила археологов в тупик
Будет ли разгадан этот детектив каменного века?...
Самый большой кратер на Луне оказался гораздо огромнее, чем предполагали ученые
А еще «воронка» в четверть планеты скрывает неожиданные тайны....
Преждевременная сенсация: скептики убавили восторгов насчёт расщепления личинками пенопласта
Пожирать — не значит перерабатывать....
Глубокая голубая дыра на Багамах открывает тайны ледникового периода
Невероятная и поразительная история одного открытия....