Исследователи создали датасет под названием ChattyChef, в котором используются модели обработки естественного языка, и эта разработка способна помочь пользователю приготовить блюдо по рецепту. Диалоговая система приготовления ChattyChef следует рецептам вместе с пользователем, используя большую языковую модель с открытым исходным кодом GPT-J.
Исследователи описали свой ИИ в статье «Улучшенный порядок инструкций в диалоге, основанном на рецептах», представленной на 61-м ежегодном собрании Ассоциации компьютерной лингвистики.
Хотя другие исследователи только строили теории о возможности создания ИИ-повара, вычислительный колледж продвинулся на шаг вперед.
Что не так с роботами-поварами?
Большинство попыток использования языковых моделей для приготовления пищи терпят неудачу, потому что GPT-J не понимает, что пользователь хочет сделать дальше, а также с трудом отслеживает, насколько далеко пользователь продвинулся в рамках рецепта. Также большой языковой модели сложно ответить на уточняющие вопросы, например, о количестве ингредиентов или времени приготовления.
Например, человек пытается приготовить картофельные оладьи. ИИ советует ему растопить масло на сковороде и добавить картофель. Затем пользователь спрашивает, какой будет следующий шаг. Робот может перепутать порядок и предлагает подать оладьи, даже если они еще не готовы. Или пользователь задает дополнительный вопрос о том, как долго выпекать оладьи, в ответ на что программа сообщит общее время приготовления, не указав время обжаривания для каждой стороны.
Учитывая все это, исследователи поняли, что их модель имеет две ключевые особенности:
Обнаружение намерений пользователя в рамках фиксированного набора возможностей, таких как «Запросить следующую инструкцию» или «Запросить подробности об ингредиентах».
Отслеживание состояния инструкций для определения того, на каком этапе рецепта находится пользователь, что работает с точностью 80%.
Фрагмент диалога с инструкцией по приготовлению пищи: хорошие и плохие ответы системы, а также соответствующий тип ошибки для каждого неправильного ответа.
Таким образом, искусственный интеллект предлагает пользователю лучший вариант ответа. Ответ включает в себя наиболее важные части рецепта, а не выдает его целиком, и это помогает не сбивать пользователя с толку и не обременять его дополнительными шагами во время приготовления.
Датасет ChattyChef создан на основе рецептов WikiHow с положительными оценками. Также разработчики пригласили группу людей для того, чтобы определить наиболее важные вопросы в общении с роботом-поваром.
Исследователи считают, что наработки ChattyChef можно использовать не только в кулинарии, но и в других областях, например, в руководствах по ремонту или документациях по программному обеспечению.