
Новая структура обучения роботов: перевод человеческих рассуждений в повседневные задачи
Представьте себе робота, который может стать вашим идеальным помощником в выполнении повседневных задач по дому. Однако, когда вы просите его выполнить определенную задачу, он может столкнуться с трудностями из-за отличий в окружающей среде. Это было сложной задачей для ученых, которые занялись разработкой новой структуры обучения роботов, позволяющей им учиться быстрее и эффективнее.
Главным элементом этой структуры является способность робота объяснять свои неудачи и получать обратную связь от пользователя. Энди Пэн, аспирант электротехники и информатики (EECS) в Массачусетском технологическом институте, выступил ведущим исследователем в этой области. Пэн и его команда ученых из Массачусетского технологического института, Нью-Йоркского университета и Калифорнийского университета в Беркли разработали инновационную структуру, которая позволяет сконцентрировать обучение робота на выполнении конкретных задач с минимальными усилиями со стороны пользователей.
Структура основана на использовании алгоритма, который генерирует контрфактивные объяснения, объясняющие причину неудачи робота. Например, робот может не узнать кружку на столе из-за необычного декора на кружке. Это объяснение презентуется пользователю, который может дать обратную связь и помочь роботу понять, что нужно изменить, чтобы успешно выполнять задачи.
Ключевым моментом в структуре является использование обратной связи от пользователя для корректировки данных и точной настройки робота. Это позволяет роботам учиться эффективно и быстро, используя полученную информацию от людей.
— Энди Пэн.
Исследователи предложили три шага для этого процесса. Во-первых, система показывает задачу, в которой робот не справился. Затем пользователь демонстрирует желаемое действие, а система генерирует контрфактические объяснения для сравнения. Пользователь предоставляет обратную связь, и система создает новые данные, которые помогут улучшить робота.
Энди Пэн отмечает, что новая структура позволяет учить роботов эффективнее без необходимости демонстрировать тысячи примеров. Это означает, что робот может понять, как выполнять задачу с помощью только одного образца и самостоятельно определять контекст и важные элементы.
— Энди Пэн.
Ключевой принцип работы структуры — увеличение объема данных. Например, если робот не распознает кружку определенного цвета, это может быть связано с недостатком данных в обучающих примерах. Добавление большего разнообразия в обучающие данные позволяет роботу лучше понять контекст и обобщать информацию.
Результаты исследования успешно проверены в нескольких симуляциях. Роботы, обученные с использованием этой структуры, демонстрировали лучшие результаты в выполнении задач за меньшее время.
Главным элементом этой структуры является способность робота объяснять свои неудачи и получать обратную связь от пользователя. Энди Пэн, аспирант электротехники и информатики (EECS) в Массачусетском технологическом институте, выступил ведущим исследователем в этой области. Пэн и его команда ученых из Массачусетского технологического института, Нью-Йоркского университета и Калифорнийского университета в Беркли разработали инновационную структуру, которая позволяет сконцентрировать обучение робота на выполнении конкретных задач с минимальными усилиями со стороны пользователей.
Структура основана на использовании алгоритма, который генерирует контрфактивные объяснения, объясняющие причину неудачи робота. Например, робот может не узнать кружку на столе из-за необычного декора на кружке. Это объяснение презентуется пользователю, который может дать обратную связь и помочь роботу понять, что нужно изменить, чтобы успешно выполнять задачи.
Ключевым моментом в структуре является использование обратной связи от пользователя для корректировки данных и точной настройки робота. Это позволяет роботам учиться эффективно и быстро, используя полученную информацию от людей.
Это было ясно сразу. Люди хороши в этом типе контрфактических рассуждений. И этот контрфактивный шаг — то, что позволяет человеческое мышление быть переведенным в рассуждения роботов так, чтобы это имело смысл
— Энди Пэн.
Исследователи предложили три шага для этого процесса. Во-первых, система показывает задачу, в которой робот не справился. Затем пользователь демонстрирует желаемое действие, а система генерирует контрфактические объяснения для сравнения. Пользователь предоставляет обратную связь, и система создает новые данные, которые помогут улучшить робота.
Энди Пэн отмечает, что новая структура позволяет учить роботов эффективнее без необходимости демонстрировать тысячи примеров. Это означает, что робот может понять, как выполнять задачу с помощью только одного образца и самостоятельно определять контекст и важные элементы.
Мы хотим, чтобы роботы делали то, что делают люди, и мы хотим, чтобы они делали это семантически значимым образом. Люди имеют тенденцию работать в этом абстрактном пространстве, где они не думают о каждом свойстве в изображении. В конце концов, речь идет о том, чтобы позволить роботу выучить хорошее, человекоподобное представление на абстрактном уровне
— Энди Пэн.
Ключевой принцип работы структуры — увеличение объема данных. Например, если робот не распознает кружку определенного цвета, это может быть связано с недостатком данных в обучающих примерах. Добавление большего разнообразия в обучающие данные позволяет роботу лучше понять контекст и обобщать информацию.
Результаты исследования успешно проверены в нескольких симуляциях. Роботы, обученные с использованием этой структуры, демонстрировали лучшие результаты в выполнении задач за меньшее время.
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас

60 000 лет без розетки: Как пустыня Гоби зарядит весь Китай
Похоже, электричество будет дешевле воздуха....

Стеклянный свидетель катастрофы: что нашли в черепе человека из Геркуланума?
Ученые установили, как мозг превратился в стекло за считаные минуты....

85 миллионов лет в морозильнике: кто вытащил Землю из вечной зимы?
Ученые рассказали, почему ледяной ад пошел планете на пользу....

Археологи краснеют: стало понятно, почему Стоунхендж «встал» на века
Последнее исследование говорит, что в центре комплекса стоял почти 3-метровый фаллос....

Тающие ледники Норвегии открыли очередную порцию древних артефактов
Эксперты говорят: с каждым годом ледниковая археология становится все перспективнее!...

Двухэтажные кресла в корне могут изменить путешествия на самолетах
Почему многие эксперты и пассажиры настроены против этого проекта?...

Когда-то Марс был «пляжной» планетой, похожей на лучшие курорты
Марсоход «Чжужун» обнаружил берег древнего океана. Осталось найти жизнь…...

Посадка «Голубого призрака» на Луну прошла идеально
К тому же она оказалась весьма экономичной....

Самые мощные космические лучи во Вселенной потребуют переписать законы физики
Поразительное открытие было сделано недавно в России....

Вулкан поднимает древнеримский «Лас-Вегас» из итальянского озера
Уникальная вилла вышла наружу....

Skype доживает последние дни: в мае 2025 года Microsoft отключит его на Windows
Почему легендарный мессенджер был обречен уже много лет назад?...

Зато шерстистая: проект по возрождению мамонта создал… мышь
Учёные генетически сконструировали особенных грызунов. Но зачем?...

33 миллиона тонн льда в час: Гренландия тает быстрее, чем прогнозировалось
Новое исследование раскрыло сроки «переломного момента» для северных ледников....

Телепатия для всех? Ученые нашли способ «включить» скрытые способности мозга
Канадские исследователи разблокировали экстрасенсорику с помощью магнитных импульсов....

Истинная сверхсамка: крупнейший в мире клон нашли в Балтийском море
Простирается на 500 км....

Кот Шредингера, который гуляет сам по себе... и спасает квантовые технологии
История о том, как «кошачьи» кубиты от Amazon могут изменить будущее технологий без лишнего пафоса....