3 мая 2024 401

Нарочная случайность в ИИ для роботов улучшила результаты

Инженеры из Северо-Западного университета, США, разработали новый алгоритм искусственного интеллекта (ИИ) специально для робототехники. Помогая таким устройствам быстро и надёжно развивать сложные навыки, метод значительно повышает практичность и безопасность роботов.

Алгоритм получил название Maximum Diffusion Reinforcement Learning (MaxDiffRL), что можно перевести как «усиленное обучение с максимальным рассеянием». Программное обеспечение (ПО) побуждает роботов исследовать окружающую среду наиболее случайным образом ради всестороннего опыта.

Нарочито заложенная случайность улучшает качество данных, собираемых роботами вокруг себя. В компьютерной модели виртуальные устройства обучались быстрее и эффективнее, повышая тем самым надёжность и производительность.

При тестировании в сравнении с иными видами ИИ компьютерные имитации с использованием алгоритма MaxDiffRL неизменно превосходили прочие самые современные модели. Фактически, новый алгоритм работает настолько хорошо, что роботы выучивают новые задачи, а затем успешно выполняют их при первой же попытке. То есть благодаря MaxDiffRL делают всё правильно с первого раза. Это резко контрастирует с существующими моделями ИИ, при которых обучение идёт методом проб и ошибок, то есть куда медленнее.

С нашей платформой каждый раз, когда вы включаете робота, он делает именно то, о чём его попросили

— Томас Берруэта, руководитель исследования.

Обычно для тренировки алгоритмов машинного обучения исследователи и разработчики используют большие объёмы данных, которые тщательно фильтруются и обрабатываются людьми. ИИ учится на этих данных действительно методом проб и ошибок, пока не достигнет оптимальных результатов. Процесс этот хорошо работает для софтверных систем, в форме ПО, таких как ChatGPT и Google Gemini. Но метод не столь эффективен для воплощённых, физических, устройств с ИИ, таких как роботы. Вот почему нормально, чтобы роботы собирали информацию самостоятельно, без копания людей в данных.

Чтобы протестировать новый алгоритм, исследователи запустили компьютерное моделирование, дав задание продолговатым виртуальным роботам выполнять ряд стандартных задач. В целом модели с MaxDiffRL, обучались быстрее других. Они также корректно выполняли команды намного последовательнее и надёжнее, чем другие «змейки». Прячём, как уже было сказано, с первой попытки, начав без каких-либо предварительных знаний о ситуации.

Берруэта заявил, что созданные им с коллегами роботы были быстрее и манёвреннее. А это стало бы огромным преимуществом для реальных устройств.

Кстати, MaxDiffRL необязательно использовать только для перемещающихся роботов. Например, он вполне бы подошёл для манипулятора на кухне, который учится загружать различную утварь в посудомоечную машину. Потенциально применение — беспилотные автомобили и летательные аппараты, домашняя робототехника и автоматизация различных процессов.

Итак, MaxDiffRL — это алгоритм широкого назначения, его можно использовать для множества целей. Исследователи надеются, что созданное ими ПО решит фундаментальные проблемы отрасли, и в конечном итоге проложит путь к надёжному принятию решений в робототехнике.

Дмитрий Ладыгин
youtu.be/P5Dpb21es58

Наши новостные каналы

Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.

ВКонтакте Дзен Одноклассники

Конец 30-летней легенды: Эверест может лишиться одного из главных символов

Эксперты предупреждают индийское правительство: экспедиция будет крайне опасной и вряд ли закончится успехом. Почему?...

1 июл 2026 17 568

Феномен Великой Зеленой стены: за счет чего 66 миллиардов деревьев, высаженных Китаем, растут быстрее естественных лесов?

И почему ученые решили, что природные леса все-таки лучше рукотворных?...

3 июл 2026 12 134

Тайна золотого вулкана: почему гора в Антарктике извергает драгоценный металл?

Нарочная случайность в ИИ для роботов улучшила результаты

Конец 30-летней легенды: Эверест может лишиться одного из главных символов

Феномен Великой Зеленой стены: за счет чего 66 миллиардов деревьев, высаженных Китаем, растут быстрее естественных лесов?

Тайна золотого вулкана: почему гора в Антарктике извергает драгоценный металл?

Тайну четырех черных яиц с 6000-метров глубины океана раскрыли японские ученые

Проклятье 30 июня: почему в этот день произошло столько крупных катастроф?

Секрет охоты на мамонтов открыт: ученые только что разрушили один из главных мифов древней истории

Ученые «разжаловали» индонезийских хоббитов из умников: огнем не владели, подъедались за варанами

Аномальный дождь из рыбы: 150 лет ученые не могут объяснить эту тайну природы

Космический детектив: почему уникальную планету GJ 3378b никак не признают «второй Землей»?

316 лет на троих: ученые назвали три секрета феноменального долголетия сестер Нунес

Серная кислота в небе: чем грозит пассажирам новый экологический проект?