
Тайна сознания раскрыта: робот с особенным ИИ показал, как машины и дети учатся понимать
Мы, люди, отлично умеем обобщать. Если научить ребёнка различать красный цвет, показав ему красный мяч, красный грузовик и красный цветок, он, скорее всего, правильно назовёт цвет спелого помидора, даже если увидит его впервые.
При обучении обобщению важна композиционность — это способность различать в уме основные признаки, например, красный цвет предмета. Как мы приобретаем эту способность распознавать и обобщать — основной вопрос нейробиологии развития человека, а также исследований в области искусственного интеллекта (ИИ).
Самые первые типы ИИ — это компьютерные нейронные сети, которые впоследствии превратились в большие языковые модели (БЯМ). Разрабатывали этих «первенцев» для изучения того, как информация обрабатывается в нашем мозге. По мере усложнения этих моделей пути обработки информации внутри них также становились всё более сложными, так что у некоторых БЯМ сегодня — триллионы настраиваемых параметров.

Сотрудники исследовательского отдела когнитивной нейроробототехники в Институте науки и технологий Окинавы (OIST), что в Японии, создали модель воплощённого в механизм ИИ с новой архитектурой. Такой подход позволил исследователям получать доступ к различным внутренним состояниям нейронной сети, которая, как оказалось, учится обобщать так же, как это делают дети.
Экспериментальной установкой послужил показанный на верхнем фото манипулятор Torobo производства компании Tokyo Robotic с семью степенями свободы. Ему поручили задачу перемещать кубики разных цветов со сторонами по 5 см.
Первый автор исследования Прасанна Виджаярагхаван объяснил, что механизм помог нейронной сети достичь композиционности.
— Виджаярагхаван.
Поясним, что проприоцепцией в биологии называют ощущение в пространстве своего тела и его частей.
Существуют БЯМ, которые учатся статистическим взаимосвязям между словами в предложениях на основе огромного количества текстов. Имея доступ к каждому слову во всевозможных сочетаниях с другими словами, они предсказывают наиболее вероятный ответ на заданный вопрос.
Напротив, новая модель родом с Окинавы основана на программной платформе PV-RNN. Сокращение означает «Вариационная рекуррентная нейронная сеть, основанная на прогнозирующем кодировании». (Рекуррентность в математике — это вычисления на основе значений предыдущих членов последовательности).
PV-RNN обучали на движениях манипулятора и восприятии робота: зрение с видеозаписью «руки», перемещающей кубики; проприоцепция при движении «хваталки»; языковая инструкция, вроде «поставь красное на синее».
Затем БЯМ ставили задачу либо перечислить углы наклона суставов манипулятора в ответ на языковую инструкцию, либо сгенерировать языковую инструкцию в ответ на сенсорный ввод.
Система с PV-RNN основана на принципе свободной энергии. Он предполагает, что наш мозг постоянно прогнозирует сенсорные данные на основе прошлого опыта и предпринимает действия, чтобы минимизировать разницу между предположением и видимым. Разница эта измеряется свободной энергией, то есть неопределённостью. Сводя к минимуму объёмы свободной энергии, наш мозг поддерживает собственную стабильность.
Оснащённый ограниченными рабочей памятью и способностью сосредотачиваться, ИИ родом с Окинавы отражал когнитивные (умственные) ограничения в голове человека. Это вынуждало робота обрабатывать вводные и обновлять свои прогнозы последовательно, а не сразу, как это делают обычно БЯМ.
Изучая поток информации внутри модели ИИ, исследователи могли понять, как компьютер объединяет различные входные данные для прогнозирования действий. Именно благодаря этому модульному подходу исследователи узнали о том, как у младенцев может развиваться способность к составлению башенок из кубиков.
Как рассказал Виджаярагхаван, чем чаще модель сталкивалась с одним и тем же словом в разных контекстах, тем лучше она запоминала это слово. Это было похоже на реальную жизнь, ведь ребёнок гораздо быстрее усвоит понятие «красный цвет», если будет взаимодействовать с разными красными предметами, а не просто несколько раз поиграет только лишь красным грузовиком.
— Виджаярагхаван.
Именно эта особенность делает окинавскую модель такой полезной для когнитивистов, то есть специалистов, которые изучают реакции центральной нервной системы человека на определённые события и анализируют умственные процессы. А также эксперименты Виджаярагхавана и его коллег интересны исследователям ИИ, которые пытаются отобразить процессы принятия решений в своих компьютерных моделях.
Да, PV-RNN не сравнится в эффективности с БЯМ, но у неё своя цель — показывать, как построить нейронные сети для понимания способов обработки информации. Относительно простая архитектура PV-RNN позволяет исследователям наглядно показать работу алгоритмов — как информация из прошлого используется для прогнозирования в текущем моменте.

Особая модель также решает проблему «бедности стимулов». Заключается проблема в том, что словарного запаса, доступного детям, недостаточно для объяснений. У экспериментальной модели также бедный набор данных, особенно по сравнению с БЯМ, но она всё равно достигает композиционности. Наблюдения за манипулятором с PV-RNN позволяют предположить, что связь слов с действиями объясняет, как дети с такой поразительной скоростью за несколько лет осваивают язык.
Как мы обретаем и развиваем свой разум — один из важнейших вопросов науки. Хотя PV-RNN не даёт на него ответа, искусственная нейронная сеть указывает, каким путём лучше исследовать вопрос обработки информации в нашем мозге.
— Виджаярагхаван.
При обучении обобщению важна композиционность — это способность различать в уме основные признаки, например, красный цвет предмета. Как мы приобретаем эту способность распознавать и обобщать — основной вопрос нейробиологии развития человека, а также исследований в области искусственного интеллекта (ИИ).
Самые первые типы ИИ — это компьютерные нейронные сети, которые впоследствии превратились в большие языковые модели (БЯМ). Разрабатывали этих «первенцев» для изучения того, как информация обрабатывается в нашем мозге. По мере усложнения этих моделей пути обработки информации внутри них также становились всё более сложными, так что у некоторых БЯМ сегодня — триллионы настраиваемых параметров.

Сотрудники исследовательского отдела когнитивной нейроробототехники в Институте науки и технологий Окинавы (OIST), что в Японии, создали модель воплощённого в механизм ИИ с новой архитектурой. Такой подход позволил исследователям получать доступ к различным внутренним состояниям нейронной сети, которая, как оказалось, учится обобщать так же, как это делают дети.
Экспериментальной установкой послужил показанный на верхнем фото манипулятор Torobo производства компании Tokyo Robotic с семью степенями свободы. Ему поручили задачу перемещать кубики разных цветов со сторонами по 5 см.
Первый автор исследования Прасанна Виджаярагхаван объяснил, что механизм помог нейронной сети достичь композиционности.
Наша модель достигала этого не с помощью «умозаключений», основанных на обширных наборах данных. Ей помогли понимание языка, зрение, проприоцепция, рабочая память и внимание — так же это делают дети младшего возраста
— Виджаярагхаван.
Поясним, что проприоцепцией в биологии называют ощущение в пространстве своего тела и его частей.
Существуют БЯМ, которые учатся статистическим взаимосвязям между словами в предложениях на основе огромного количества текстов. Имея доступ к каждому слову во всевозможных сочетаниях с другими словами, они предсказывают наиболее вероятный ответ на заданный вопрос.
Напротив, новая модель родом с Окинавы основана на программной платформе PV-RNN. Сокращение означает «Вариационная рекуррентная нейронная сеть, основанная на прогнозирующем кодировании». (Рекуррентность в математике — это вычисления на основе значений предыдущих членов последовательности).
PV-RNN обучали на движениях манипулятора и восприятии робота: зрение с видеозаписью «руки», перемещающей кубики; проприоцепция при движении «хваталки»; языковая инструкция, вроде «поставь красное на синее».
Затем БЯМ ставили задачу либо перечислить углы наклона суставов манипулятора в ответ на языковую инструкцию, либо сгенерировать языковую инструкцию в ответ на сенсорный ввод.
Система с PV-RNN основана на принципе свободной энергии. Он предполагает, что наш мозг постоянно прогнозирует сенсорные данные на основе прошлого опыта и предпринимает действия, чтобы минимизировать разницу между предположением и видимым. Разница эта измеряется свободной энергией, то есть неопределённостью. Сводя к минимуму объёмы свободной энергии, наш мозг поддерживает собственную стабильность.
Оснащённый ограниченными рабочей памятью и способностью сосредотачиваться, ИИ родом с Окинавы отражал когнитивные (умственные) ограничения в голове человека. Это вынуждало робота обрабатывать вводные и обновлять свои прогнозы последовательно, а не сразу, как это делают обычно БЯМ.
Изучая поток информации внутри модели ИИ, исследователи могли понять, как компьютер объединяет различные входные данные для прогнозирования действий. Именно благодаря этому модульному подходу исследователи узнали о том, как у младенцев может развиваться способность к составлению башенок из кубиков.
Как рассказал Виджаярагхаван, чем чаще модель сталкивалась с одним и тем же словом в разных контекстах, тем лучше она запоминала это слово. Это было похоже на реальную жизнь, ведь ребёнок гораздо быстрее усвоит понятие «красный цвет», если будет взаимодействовать с разными красными предметами, а не просто несколько раз поиграет только лишь красным грузовиком.
Для достижения композиционности нашей модели требуется значительно меньший набор обучающих данных и гораздо меньшая вычислительная мощность. Она допускает больше ошибок, чем БЯМ, но эти ошибки похожи на те, что свойственны людям
— Виджаярагхаван.
Именно эта особенность делает окинавскую модель такой полезной для когнитивистов, то есть специалистов, которые изучают реакции центральной нервной системы человека на определённые события и анализируют умственные процессы. А также эксперименты Виджаярагхавана и его коллег интересны исследователям ИИ, которые пытаются отобразить процессы принятия решений в своих компьютерных моделях.
Да, PV-RNN не сравнится в эффективности с БЯМ, но у неё своя цель — показывать, как построить нейронные сети для понимания способов обработки информации. Относительно простая архитектура PV-RNN позволяет исследователям наглядно показать работу алгоритмов — как информация из прошлого используется для прогнозирования в текущем моменте.

Особая модель также решает проблему «бедности стимулов». Заключается проблема в том, что словарного запаса, доступного детям, недостаточно для объяснений. У экспериментальной модели также бедный набор данных, особенно по сравнению с БЯМ, но она всё равно достигает композиционности. Наблюдения за манипулятором с PV-RNN позволяют предположить, что связь слов с действиями объясняет, как дети с такой поразительной скоростью за несколько лет осваивают язык.
Как мы обретаем и развиваем свой разум — один из важнейших вопросов науки. Хотя PV-RNN не даёт на него ответа, искусственная нейронная сеть указывает, каким путём лучше исследовать вопрос обработки информации в нашем мозге.
Наблюдая за тем, как машина учится сочетать язык и действия, мы получаем представление о фундаментальных процессах, лежащих в основе человеческого познания
— Виджаярагхаван.
- Дмитрий Ладыгин
- dx.doi.org
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас

Планшет, пролежавший в Темзе пять лет, помог раскрыть серию запутанных преступлений
Эксперты говорят: даже вода не смогла стереть цифровые следы....

«Инопланетяне» на Земле? Древние 8-метровые «грибы» оказались совершенно неизвестной формой жизни
Вот уже 180 лет подряд живые «башни» ставят в тупик всю науку....

«Шерстистый дьявол» обнаружен в пустыне, на границе Мексики и США
Ученые говорят: такой уникальной находки не было последние полвека....

Американские спецслужбы скрывают правду о самой древней из библейских реликвий?
Экстрасенс ЦРУ предупредил: Ковчег Завета убьет каждого, кто к нему прикоснется....

Похоже, что проблема космического мусора в скором времени будет решена раз и навсегда
Новая технология не только очистит космос, но и поможет спутникам работать втрое дольше....

Почему мы не помним себя младенцами? Новое исследование дало ответы
Возможно, помним, но «ларчик» заперт....

Археологи ликуют: в Испании нашли рисунки, которые старше человечества!
200 000-летняя находка заставит пересмотреть учебники....

Скрытые миллиарды: население Земли оказалось гораздо больше, чем считалось
Новые исследования бросают вызов официальным демографическим данным....

Астрофизики рассказали, почему Вселенная замедляется вопреки предсказаниям Эйнштейна
Если открытие DESI и ослабление темной энергии подтвердится, учебники придется переписать....

Ученые поражены: мыши, как спасатели, оживляют своих сородичей, попавших в беду
Открытие, от которого дрогнет даже самое черствое сердце....

Кислород устарел! Ученые нашли новый ключ к внеземной жизни
Гицеанические миры могут стать новой надеждой астрофизиков....

На 100 000 лет раньше людей: ученые рассказали, кто устроил первые похороны на планете
Загадочные карлики Homo naledi, чей мозг был размером с апельсин, оказались не глупее нас с вами....

Секретная мутация гена: оказалось, ее имеют все обитатели Марианской впадины
Поразительное открытие китайских ученых может изменить всю теорию эволюции....

10 лет за 48 часов: ИИ полностью переиграл ученых в поисках секрета супербактерий
Однако эксперты предупреждают: нейросети не только ускоряют науку, они запросто могут столкнуть нас в пропасть....

Самые массовые и дикие розыгрыши на 1 апреля в мировой истории
Это вам не просто «вся спина белая»....

iPhone, давай до свидания! Илон Маск презентовал инновационный смартфон PhoneX
Это устройство слишком прекрасно для нашей реальности....