Новая структура обучения роботов: перевод человеческих рассуждений в повседневные задачи
Представьте себе робота, который может стать вашим идеальным помощником в выполнении повседневных задач по дому. Однако, когда вы просите его выполнить определенную задачу, он может столкнуться с трудностями из-за отличий в окружающей среде. Это было сложной задачей для ученых, которые занялись разработкой новой структуры обучения роботов, позволяющей им учиться быстрее и эффективнее.
Главным элементом этой структуры является способность робота объяснять свои неудачи и получать обратную связь от пользователя. Энди Пэн, аспирант электротехники и информатики (EECS) в Массачусетском технологическом институте, выступил ведущим исследователем в этой области. Пэн и его команда ученых из Массачусетского технологического института, Нью-Йоркского университета и Калифорнийского университета в Беркли разработали инновационную структуру, которая позволяет сконцентрировать обучение робота на выполнении конкретных задач с минимальными усилиями со стороны пользователей.
Структура основана на использовании алгоритма, который генерирует контрфактивные объяснения, объясняющие причину неудачи робота. Например, робот может не узнать кружку на столе из-за необычного декора на кружке. Это объяснение презентуется пользователю, который может дать обратную связь и помочь роботу понять, что нужно изменить, чтобы успешно выполнять задачи.
Ключевым моментом в структуре является использование обратной связи от пользователя для корректировки данных и точной настройки робота. Это позволяет роботам учиться эффективно и быстро, используя полученную информацию от людей.
— Энди Пэн.
Исследователи предложили три шага для этого процесса. Во-первых, система показывает задачу, в которой робот не справился. Затем пользователь демонстрирует желаемое действие, а система генерирует контрфактические объяснения для сравнения. Пользователь предоставляет обратную связь, и система создает новые данные, которые помогут улучшить робота.
Энди Пэн отмечает, что новая структура позволяет учить роботов эффективнее без необходимости демонстрировать тысячи примеров. Это означает, что робот может понять, как выполнять задачу с помощью только одного образца и самостоятельно определять контекст и важные элементы.
— Энди Пэн.
Ключевой принцип работы структуры — увеличение объема данных. Например, если робот не распознает кружку определенного цвета, это может быть связано с недостатком данных в обучающих примерах. Добавление большего разнообразия в обучающие данные позволяет роботу лучше понять контекст и обобщать информацию.
Результаты исследования успешно проверены в нескольких симуляциях. Роботы, обученные с использованием этой структуры, демонстрировали лучшие результаты в выполнении задач за меньшее время.
Главным элементом этой структуры является способность робота объяснять свои неудачи и получать обратную связь от пользователя. Энди Пэн, аспирант электротехники и информатики (EECS) в Массачусетском технологическом институте, выступил ведущим исследователем в этой области. Пэн и его команда ученых из Массачусетского технологического института, Нью-Йоркского университета и Калифорнийского университета в Беркли разработали инновационную структуру, которая позволяет сконцентрировать обучение робота на выполнении конкретных задач с минимальными усилиями со стороны пользователей.
Структура основана на использовании алгоритма, который генерирует контрфактивные объяснения, объясняющие причину неудачи робота. Например, робот может не узнать кружку на столе из-за необычного декора на кружке. Это объяснение презентуется пользователю, который может дать обратную связь и помочь роботу понять, что нужно изменить, чтобы успешно выполнять задачи.
Ключевым моментом в структуре является использование обратной связи от пользователя для корректировки данных и точной настройки робота. Это позволяет роботам учиться эффективно и быстро, используя полученную информацию от людей.
Это было ясно сразу. Люди хороши в этом типе контрфактических рассуждений. И этот контрфактивный шаг — то, что позволяет человеческое мышление быть переведенным в рассуждения роботов так, чтобы это имело смысл
— Энди Пэн.
Исследователи предложили три шага для этого процесса. Во-первых, система показывает задачу, в которой робот не справился. Затем пользователь демонстрирует желаемое действие, а система генерирует контрфактические объяснения для сравнения. Пользователь предоставляет обратную связь, и система создает новые данные, которые помогут улучшить робота.
Энди Пэн отмечает, что новая структура позволяет учить роботов эффективнее без необходимости демонстрировать тысячи примеров. Это означает, что робот может понять, как выполнять задачу с помощью только одного образца и самостоятельно определять контекст и важные элементы.
Мы хотим, чтобы роботы делали то, что делают люди, и мы хотим, чтобы они делали это семантически значимым образом. Люди имеют тенденцию работать в этом абстрактном пространстве, где они не думают о каждом свойстве в изображении. В конце концов, речь идет о том, чтобы позволить роботу выучить хорошее, человекоподобное представление на абстрактном уровне
— Энди Пэн.
Ключевой принцип работы структуры — увеличение объема данных. Например, если робот не распознает кружку определенного цвета, это может быть связано с недостатком данных в обучающих примерах. Добавление большего разнообразия в обучающие данные позволяет роботу лучше понять контекст и обобщать информацию.
Результаты исследования успешно проверены в нескольких симуляциях. Роботы, обученные с использованием этой структуры, демонстрировали лучшие результаты в выполнении задач за меньшее время.
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Как на ладони: Обнаружен морской гигант, который виден из космоса
Мегакоралл у Соломоновых островов оказался самым крупным животным Земли....
Спасти планету сможет… африканский червь
В Кении найдено насекомое с удивительными способностями....
Забудьте всё, что вы знали о Луне
Новая теория предлагает в корне иное происхождение ночного светила....
Главная тайна Седьмой планеты разгадана через 38 лет
Уран оказался не таким уж странным, как думали ученые....
80 000 лет жизни: какие тайны скрывает самое древнее и большое существо на планете?
Залог невероятного долголетия и удивительного выживания обнаружили учёные....
«Орешник», «Бук» и «Тополь»: искусный нейминг от российских военных конструкторов
Наука как сбить Запад с толку....
Раскрыт секрет идеального женского тела?
Оказывается, дело вовсе не в соотношении талии и бедер....
Янтарь из недр Антарктиды раскрыл тайны тропических лесов
Застывшая смола возрастом 90 млн лет как часть исчезнувшей экосистемы....
Саблезубый котёнок томился во льдах Якутии 35 тысяч лет
Благодаря находке стало известно, что сородичи пушистика обитали в столь холодных местах....
Ученая вылечила свой рак вирусами собственного производства
Если человек хочет жить — медицина бессильна....
Носи умные очки или увольняйся!
Amazon планирует заставить всех курьеров носить этот электронный прибор....
Разгадано учеными: почему города разрушают сердце и разум
Причины, которые нашли исследователи, вас удивят....
Почти бессмертные существа помогут человечеству покорить глубокий космос
Ученым, наконец, удалось «взломать» код поразительной живучести тихоходок....
Турбулентность отменяется! А пилоты-люди вообще будут не нужны
Искусственный интеллект может в корне изменить авиацию....
Надеялись на Беса: древние египтянки при беременности хлебали галлюциногенные смеси
Думали, что божок с двусмысленным для нас именем убережёт....
Чудо в перьях: Робот-голубь «упорхнёт» от радиолокации
Изобретение грозит новой гонкой вооружений....