
Новая структура обучения роботов: перевод человеческих рассуждений в повседневные задачи
Представьте себе робота, который может стать вашим идеальным помощником в выполнении повседневных задач по дому. Однако, когда вы просите его выполнить определенную задачу, он может столкнуться с трудностями из-за отличий в окружающей среде. Это было сложной задачей для ученых, которые занялись разработкой новой структуры обучения роботов, позволяющей им учиться быстрее и эффективнее.
Главным элементом этой структуры является способность робота объяснять свои неудачи и получать обратную связь от пользователя. Энди Пэн, аспирант электротехники и информатики (EECS) в Массачусетском технологическом институте, выступил ведущим исследователем в этой области. Пэн и его команда ученых из Массачусетского технологического института, Нью-Йоркского университета и Калифорнийского университета в Беркли разработали инновационную структуру, которая позволяет сконцентрировать обучение робота на выполнении конкретных задач с минимальными усилиями со стороны пользователей.
Структура основана на использовании алгоритма, который генерирует контрфактивные объяснения, объясняющие причину неудачи робота. Например, робот может не узнать кружку на столе из-за необычного декора на кружке. Это объяснение презентуется пользователю, который может дать обратную связь и помочь роботу понять, что нужно изменить, чтобы успешно выполнять задачи.
Ключевым моментом в структуре является использование обратной связи от пользователя для корректировки данных и точной настройки робота. Это позволяет роботам учиться эффективно и быстро, используя полученную информацию от людей.
— Энди Пэн.
Исследователи предложили три шага для этого процесса. Во-первых, система показывает задачу, в которой робот не справился. Затем пользователь демонстрирует желаемое действие, а система генерирует контрфактические объяснения для сравнения. Пользователь предоставляет обратную связь, и система создает новые данные, которые помогут улучшить робота.
Энди Пэн отмечает, что новая структура позволяет учить роботов эффективнее без необходимости демонстрировать тысячи примеров. Это означает, что робот может понять, как выполнять задачу с помощью только одного образца и самостоятельно определять контекст и важные элементы.
— Энди Пэн.
Ключевой принцип работы структуры — увеличение объема данных. Например, если робот не распознает кружку определенного цвета, это может быть связано с недостатком данных в обучающих примерах. Добавление большего разнообразия в обучающие данные позволяет роботу лучше понять контекст и обобщать информацию.
Результаты исследования успешно проверены в нескольких симуляциях. Роботы, обученные с использованием этой структуры, демонстрировали лучшие результаты в выполнении задач за меньшее время.
Главным элементом этой структуры является способность робота объяснять свои неудачи и получать обратную связь от пользователя. Энди Пэн, аспирант электротехники и информатики (EECS) в Массачусетском технологическом институте, выступил ведущим исследователем в этой области. Пэн и его команда ученых из Массачусетского технологического института, Нью-Йоркского университета и Калифорнийского университета в Беркли разработали инновационную структуру, которая позволяет сконцентрировать обучение робота на выполнении конкретных задач с минимальными усилиями со стороны пользователей.
Структура основана на использовании алгоритма, который генерирует контрфактивные объяснения, объясняющие причину неудачи робота. Например, робот может не узнать кружку на столе из-за необычного декора на кружке. Это объяснение презентуется пользователю, который может дать обратную связь и помочь роботу понять, что нужно изменить, чтобы успешно выполнять задачи.
Ключевым моментом в структуре является использование обратной связи от пользователя для корректировки данных и точной настройки робота. Это позволяет роботам учиться эффективно и быстро, используя полученную информацию от людей.
Это было ясно сразу. Люди хороши в этом типе контрфактических рассуждений. И этот контрфактивный шаг — то, что позволяет человеческое мышление быть переведенным в рассуждения роботов так, чтобы это имело смысл
— Энди Пэн.
Исследователи предложили три шага для этого процесса. Во-первых, система показывает задачу, в которой робот не справился. Затем пользователь демонстрирует желаемое действие, а система генерирует контрфактические объяснения для сравнения. Пользователь предоставляет обратную связь, и система создает новые данные, которые помогут улучшить робота.
Энди Пэн отмечает, что новая структура позволяет учить роботов эффективнее без необходимости демонстрировать тысячи примеров. Это означает, что робот может понять, как выполнять задачу с помощью только одного образца и самостоятельно определять контекст и важные элементы.
Мы хотим, чтобы роботы делали то, что делают люди, и мы хотим, чтобы они делали это семантически значимым образом. Люди имеют тенденцию работать в этом абстрактном пространстве, где они не думают о каждом свойстве в изображении. В конце концов, речь идет о том, чтобы позволить роботу выучить хорошее, человекоподобное представление на абстрактном уровне
— Энди Пэн.
Ключевой принцип работы структуры — увеличение объема данных. Например, если робот не распознает кружку определенного цвета, это может быть связано с недостатком данных в обучающих примерах. Добавление большего разнообразия в обучающие данные позволяет роботу лучше понять контекст и обобщать информацию.
Результаты исследования успешно проверены в нескольких симуляциях. Роботы, обученные с использованием этой структуры, демонстрировали лучшие результаты в выполнении задач за меньшее время.
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас

Выяснилось, что суша вокруг Аральского моря... стремительно поднимается
И ученые сумели разгадать эту удивительную загадку природы....

В каменных гробницах древней Ирландии похоронены вовсе не те, о ком думали ученые
Генетический анализ переписывает историю неолита....

Тайна последнего Папы: сбудется ли пророчество XII века?
Три Петра, один престол: что об этом говорят историки и сам Ватикан?...

Что 220 дней в космосе сделали с 70-летним мужчиной?
Старейший астронавт NASA возвратился на Землю....

Застукали: антарктического гигантского кальмара впервые запечатлели в естественной среде
Прошёл век после открытия вида....

Невероятная история единственного человека, которому удалось проникнуть в Зону 51
Джерри Фримен не только выбрался оттуда, но и рассказал, что увидел....

«Двух монстров» засняли на камеру в знаменитом шотландском озере
Ученые не верят, но кого тогда видел очевидец?...

Американские военные приступили к строительству орбитального авианосца
Пентагон говорит, что это исключительно ради мира. Но эксперты прогнозируют военную эскалацию в космосе....

Оказывается, римляне периодически врали о своих победах в исторических хрониках
Недавно археологи обнаружили в Судане очередное яркое тому подтверждение....

Бетон в туннелях для автотранспорта гниёт удивительно быстро
Казалось бы прочный материал гложут микробы....

Китай испытал новейшую водородную, но не ядерную бомбу
Кто-то говорит, что это инновация, а кто-то, что такое уже было в СССР....

Ученые заставили человеческий глаз видеть совершенно новый цвет
Он называется оло, и его практически не описать словами....

Шимпанзе устраивают пьяные вечеринки
Похоже, у человека и близких видов это в крови....

Вороны еще раз подтвердили свою гениальность
Исследование показало, что эти птицы отлично распознают… геометрические фигуры....

Ученые доказали: вода на Земле не из космоса, а своя собственная
Она зародилась «автоматически». И это в корне меняет теорию жизни во Вселенной....

Нюхали чужие футболки: женщины полагаются на запах при выборе друзей
Наука требует странных опытов....