Досвистелись! За дельфиний язык взялся ИИ от Google
306

Досвистелись! За дельфиний язык взялся ИИ от Google

Ученые говорят, что время, когда человек и дельфин смогут обмениваться простыми фразами: «Принеси водоросли!» или «Где твой детеныш?», — настанет совсем скоро. Но уже сегодня ученые из Google, проекта «Дикий дельфин» (WDP) и Технологического института Джорджии делают первые шаги к этой реальности. Все благодаря DolphinGemma — уникальной модели искусственного интеллекта, которая учится расшифровывать язык морских млекопитающих.


Как работает эта технология? И что мы уже знаем о сложной коммуникации дельфинов? Давайте погрузимся в удивительный мир подводных «разговоров», где щелчки, свисты и импульсные сигналы могут оказаться ключом к межвидовому общению.

40 лет наблюдений


С 1985 года проект WDP изучает сообщество диких атлантических пятнистых дельфинов (Stenella frontalis) у берегов Багамских островов. Это самый продолжительный подводный исследовательский проект в мире. Ученые не вмешиваются в жизнь стаи — они наблюдают за ней «на ее условиях», фиксируя каждое движение и звук. За десятилетия накопились тысячи часов аудио и видео, где каждый дельфин имеет «паспорт»: имя, историю жизни, черты характера и даже социальные связи.

Что же удалось узнать за 40 лет наблюдений. Во-первых, каждая особь имеет уникальный фирменный свист, который можно считать своего рода звуковой подписью. Ну или именем, если хотите.

Матери используют их, чтобы найти детенышей в океанской пучине. Интересно, что дельфины могут имитировать «имена» сородичей, чтобы привлечь их внимание. Точно так же люди зовут друг друга по имени.

Досвистелись! За дельфиний язык взялся ИИ от Google
Слева: самка дельфина-афалины наблюдает за своим детенышем во время кормления. Она издает свой уникальный свист, чтобы позвать детеныша обратно, когда он закончит есть. Справа: спектрограмма для визуализации свиста


Во-вторых, стало понятно, что дельфины звуками показывают свои эмоции. Во время драк раздаются импульсные визги, а в моменты ухаживания — низкочастотные «гудки». Ученые WDP даже зафиксировали особый «смех» — серию быстрых щелчков, которые издают дельфины после успешной игры.

В-третьих, судя по всему, у дельфинов все-таки есть сложная речь. Замечено, что звуки у них складываются в последовательности, напоминающие предложения. Например, серия щелчков может предупреждать об акуле, а комбинация свистов — приглашать к игре. Некоторые последовательности повторяются в разных группах, словно устойчивые фразы.

Переводчик с дельфиньего


Раньше ученые тратили годы на ручную расшифровку дельфиньих сигналов. Теперь исследователям все чаще и чаще приходит на помощь искусственный интеллект.


Слева: свисты (слева) и импульсы (справа), полученные во время ранних испытаний DolphinGemma


В 2024 году Google представил модель DolphinGemma, созданную на основе технологий Gemma — легких ИИ-моделей, которые работают даже на смартфонах. Ее задача — найти закономерности в звуках дельфинов и генерировать ответы. Но как машина учится понимать язык, который люди не могут расшифровать десятилетиями?

Для начала технология SoundStream разбивает аудио на «слова»-токены. Точно так же делают языковые модели с человеческой речью. Например, свист длиной 0,5 секунды может стать отдельным токеном, а серия щелчков — целой «фразой».

Затем нейросеть обучилась на данных, собранных WDP. Модель с 400 млн параметров анализировала записи, связывая звуки с поведением. К примеру, свист определенной частоты ассоциировался с игрой в водоросли. В итоге ученые «скормили» ИИ 20 000 часов аудио, собранных за 40 лет.

Кроме того, подобно ChatGPT, DolphinGemma учится предугадывать, какой звук последует за текущим. Если дельфин издает «гудок», модель может предложить ответный «визг» — как если бы вы продолжили фразу: «Как дела? — …»

Уже в 2025 году ученые планируют использовать обновленные Google Pixel 9 для обработки сигналов в реальном времени прямо под водой. Смартфон, защищенный водонепроницаемым корпусом, будет записывать звуки, а DolphinGemma — мгновенно их анализировать.

Все как у людей


Google вместе с Технологическим институтом Джорджии создали специальный подводный компьютер, сердцем которого становится смартфон Pixel. Называется устройство CHAT (Cetacean Hearing Augmentation Telemetry — «Телеметрия, чтобы лучше слышать китообразных»). Цель ЭВМ — создать общий человечье-дельфиний словарь.


Google Pixel 9 внутри новейшего оборудования системы CHAT


Например, ученые придумали искусственные сигналы, обозначающие предметы, которые нравятся дельфинам. Мячи, морские губки, саргассовые водоросли. Если дельфин повторит такой сигнал, исследователь передаст ему объект.

Для обратной связи используются наушники с костной проводимостью: ученые слышат сигналы даже под водой.

Эксперты говорят, что это реальный прорыв. Раньше для анализа требовалось громоздкое оборудование. Теперь смартфон Pixel с DolphinGemma помещается в карман гидрокостюма! А энергоэффективность системы позволяет работать целый день без подзарядки.

Ученые хотят не просто обменяться сигналами, а понять главные принципы общения дельфинов. Есть ли у них аналог грамматики?
Передают ли они абстрактные понятия, вроде прошлого или будущего? Существуют ли у них «сказки» — истории, которые старшие особи рассказывают детенышам?

Уже сейчас некоторые аспекты очень удивляют исследователей. К примеру, в «речи» дельфинов есть строгий порядок слов. Если нарушить последовательность, то смысл «предложения» сильно меняется.

У дельфинов есть региональные акценты. Например, багамские дельфины издают более высокие свисты, чем их сородичи у побережья Флориды.

Детеныши перенимают «речь» у матерей, как человеческие дети. Если малыш растет в приюте, его «язык» становится беднее.

Однако путь к полному пониманию еще долог. Даже самая продвинутая модель пока не может отличить «Привет!» от «Опасность!» без контекста. Так что ученым предстоит еще очень много работы…
Наши новостные каналы

Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.

Рекомендуем для вас