Нарочная случайность в ИИ для роботов улучшила результаты
Инженеры из Северо-Западного университета, США, разработали новый алгоритм искусственного интеллекта (ИИ) специально для робототехники. Помогая таким устройствам быстро и надёжно развивать сложные навыки, метод значительно повышает практичность и безопасность роботов.
Алгоритм получил название Maximum Diffusion Reinforcement Learning (MaxDiffRL), что можно перевести как «усиленное обучение с максимальным рассеянием». Программное обеспечение (ПО) побуждает роботов исследовать окружающую среду наиболее случайным образом ради всестороннего опыта.
Нарочито заложенная случайность улучшает качество данных, собираемых роботами вокруг себя. В компьютерной модели виртуальные устройства обучались быстрее и эффективнее, повышая тем самым надёжность и производительность.
При тестировании в сравнении с иными видами ИИ компьютерные имитации с использованием алгоритма MaxDiffRL неизменно превосходили прочие самые современные модели. Фактически, новый алгоритм работает настолько хорошо, что роботы выучивают новые задачи, а затем успешно выполняют их при первой же попытке. То есть благодаря MaxDiffRL делают всё правильно с первого раза. Это резко контрастирует с существующими моделями ИИ, при которых обучение идёт методом проб и ошибок, то есть куда медленнее.
— Томас Берруэта, руководитель исследования.
Обычно для тренировки алгоритмов машинного обучения исследователи и разработчики используют большие объёмы данных, которые тщательно фильтруются и обрабатываются людьми. ИИ учится на этих данных действительно методом проб и ошибок, пока не достигнет оптимальных результатов. Процесс этот хорошо работает для софтверных систем, в форме ПО, таких как ChatGPT и Google Gemini. Но метод не столь эффективен для воплощённых, физических, устройств с ИИ, таких как роботы. Вот почему нормально, чтобы роботы собирали информацию самостоятельно, без копания людей в данных.
Чтобы протестировать новый алгоритм, исследователи запустили компьютерное моделирование, дав задание продолговатым виртуальным роботам выполнять ряд стандартных задач. В целом модели с MaxDiffRL, обучались быстрее других. Они также корректно выполняли команды намного последовательнее и надёжнее, чем другие «змейки». Прячём, как уже было сказано, с первой попытки, начав без каких-либо предварительных знаний о ситуации.

Берруэта заявил, что созданные им с коллегами роботы были быстрее и манёвреннее. А это стало бы огромным преимуществом для реальных устройств.
Кстати, MaxDiffRL необязательно использовать только для перемещающихся роботов. Например, он вполне бы подошёл для манипулятора на кухне, который учится загружать различную утварь в посудомоечную машину. Потенциально применение — беспилотные автомобили и летательные аппараты, домашняя робототехника и автоматизация различных процессов.
Итак, MaxDiffRL — это алгоритм широкого назначения, его можно использовать для множества целей. Исследователи надеются, что созданное ими ПО решит фундаментальные проблемы отрасли, и в конечном итоге проложит путь к надёжному принятию решений в робототехнике.
Алгоритм получил название Maximum Diffusion Reinforcement Learning (MaxDiffRL), что можно перевести как «усиленное обучение с максимальным рассеянием». Программное обеспечение (ПО) побуждает роботов исследовать окружающую среду наиболее случайным образом ради всестороннего опыта.
Нарочито заложенная случайность улучшает качество данных, собираемых роботами вокруг себя. В компьютерной модели виртуальные устройства обучались быстрее и эффективнее, повышая тем самым надёжность и производительность.
При тестировании в сравнении с иными видами ИИ компьютерные имитации с использованием алгоритма MaxDiffRL неизменно превосходили прочие самые современные модели. Фактически, новый алгоритм работает настолько хорошо, что роботы выучивают новые задачи, а затем успешно выполняют их при первой же попытке. То есть благодаря MaxDiffRL делают всё правильно с первого раза. Это резко контрастирует с существующими моделями ИИ, при которых обучение идёт методом проб и ошибок, то есть куда медленнее.
С нашей платформой каждый раз, когда вы включаете робота, он делает именно то, о чём его попросили
— Томас Берруэта, руководитель исследования.
Обычно для тренировки алгоритмов машинного обучения исследователи и разработчики используют большие объёмы данных, которые тщательно фильтруются и обрабатываются людьми. ИИ учится на этих данных действительно методом проб и ошибок, пока не достигнет оптимальных результатов. Процесс этот хорошо работает для софтверных систем, в форме ПО, таких как ChatGPT и Google Gemini. Но метод не столь эффективен для воплощённых, физических, устройств с ИИ, таких как роботы. Вот почему нормально, чтобы роботы собирали информацию самостоятельно, без копания людей в данных.
Чтобы протестировать новый алгоритм, исследователи запустили компьютерное моделирование, дав задание продолговатым виртуальным роботам выполнять ряд стандартных задач. В целом модели с MaxDiffRL, обучались быстрее других. Они также корректно выполняли команды намного последовательнее и надёжнее, чем другие «змейки». Прячём, как уже было сказано, с первой попытки, начав без каких-либо предварительных знаний о ситуации.

Берруэта заявил, что созданные им с коллегами роботы были быстрее и манёвреннее. А это стало бы огромным преимуществом для реальных устройств.
Кстати, MaxDiffRL необязательно использовать только для перемещающихся роботов. Например, он вполне бы подошёл для манипулятора на кухне, который учится загружать различную утварь в посудомоечную машину. Потенциально применение — беспилотные автомобили и летательные аппараты, домашняя робототехника и автоматизация различных процессов.
Итак, MaxDiffRL — это алгоритм широкого назначения, его можно использовать для множества целей. Исследователи надеются, что созданное ими ПО решит фундаментальные проблемы отрасли, и в конечном итоге проложит путь к надёжному принятию решений в робототехнике.
- Дмитрий Ладыгин
- youtu.be/P5Dpb21es58
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Еще раз об убийстве Андрея Боголюбского: что рассказали кости погибшего князя?
Профессор судебной медицины поправил историков и выявил неточности древних летописей...
Рассекречены подробности убийства Кирова: данные из архива ФСО разрушили официальную версию как карточный домик
Эксперты говорят: Сталин был совершенно не при чем. Но он использовал эту бытовую драму в своих политических интересах...
ФСБ рассекретило часть архивов Александра Вадиса, генерала «Смерш»: как советская контрразведка переиграла немцев на Курской дуге. И не только
Историки говорят: по биографии этого смершевца можно запросто снять несколько остросюжетных боевиков...
У группы Дятлова все-таки был шанс: ИИ вычислил единственный вариант, когда люди могли спастись
Оказалось, что судьба туристов была решена уже в первые три минуты трагедии. И нейросеть нашла как именно...
Почему загадочные отметины на камнях в Помпеях десятилетиями ставили в тупик военных экспертов?
Итальянские ученые неожиданно решили одну из самых запутанных загадок римской военной истории. Оказывается, уже тогда стреляли из «пулеметов»...
Найдена могила… легендарного д’Артаньяна: какие артефакты обнаружили внутри?
Почему ученые вынуждены ждать окончательного признания этой исторической сенсации?...
Украина вообще не имеет шансов: французский историк, предсказавший распад СССР, не сомневается, что Россия победит
По словам эксперта, Запад исчерпал себя как цивилизация, а потому обречен на неизбежное поражение. Это необратимый процесс...
Почему загадочный объект на Марсе — «копия» древнеегипетской пирамиды?
Что стоит за самой таинственной структурой на Красной планете? Эксперты дают объяснения, но стоит ли им верить?...
Ядерный взрыв на Луне: для чего советские ученые хотели провести такой грандиозный эксперимент?
Зачем России атомный реактор на Луне и как он поможет нам добраться до Венеры?...
Колумба могут оправдать… древние детские кости из Юго-Восточной Азии?
Что рассказали 309 скелетов во Вьетнаме? И почему история сифилиса — это очень непростая тема?...
Почему эти меры не спасут Антарктиду: пять проектов по спасению ледников оказались провалом
Эксперт жестко проанализировал самые популярные программы по сохранению льда на Шестом континенте. Увы, они оказались невыполнимой фантастикой, причем опасно...