Нешуточная задача: Российские ученые обучают ИИ чувству юмора
Комплексное исследование способности нейронных сетей распознавать и понимать юмор провела команда ученых с факультета компьютерных наук Национального исследовательского университета «Высшая школа экономики». Исследование проведено в рамках проекта «Научно-учебная лаборатория моделей и методов вычислительной прагматики». Александр Баранов, аспирант факультета компьютерных наук НИУ ВШЭ, представил результаты на конференции, проходящей в Сингапуре. Финансовую поддержку его участия в мероприятии оказал Национальный исследовательский университет «Высшая школа экономики».
Исследование показало, что для повышения точности и эффективности распознавания юмора необходимо изменить текущую методологию, используемую при разработке наборов данных, используемых для обучения этих сетей.
С середины 2000-х годов ученые посвятили свои исследования распознаванию юмора, уделяя особое внимание классификации шуток на смешные и несмешные. Для проведения этих исследований исследователи собирали и маркировали наборы данных в рамках стандартизированной структуры. Однако группа ученых из Высшей школы экономики предложила новый подход к построению таких наборов данных. Их идея состоит в том, чтобы сделать их более разнообразными, тем самым гарантируя, что они не будут ограничиваться определенным типом юмора.
Кроме того, они утверждают, что размер наборов данных не обязательно должен быть большим для достижения точных результатов. В настоящее время голосовые помощники способны только цитировать готовые шутки и не имеют возможности создавать собственные или распознавать юмористические интонации в тексте. Однако пользователи голосовых помощников на базе искусственного интеллекта требуют более человеческого взаимодействия, включая возможность распознавать и создавать объекты юмора.
Распознать юмор может быть довольно сложно из-за отсутствия формальных стандартов, позволяющих определить, что считать смешным, а что нет. В настоящее время большинство наборов данных, используемых для обучения и оценки моделей распознавания юмора, преимущественно состоят из каламбуров. Однако обнаружить сарказм и иронию еще сложнее, как и уловить ситуационный юмор, который требует понимания окружающего контекста или культурных норм.
По словам доцента факультета компьютерных наук Высшей школы экономики Павла Браславского, основной задачей ученых было оценить переносимость и стабильность моделей, прошедших обучение на различных наборах данных. В случае переносимости речь идет о том, насколько эффективно модель, обученная на определенном наборе данных с определенным типом юмора, может точно идентифицировать и понимать другой тип юмора. Сложность проведения такой оценки заключается в том, что юмор может проявляться в разных формах и вариациях, что затрудняет прогнозирование того, как будет разворачиваться тренировочный процесс.
Чтобы оценить стабильность нейронной сети, ученые провели эксперименты с использованием «состязательных атак». Эти атаки включали преднамеренную попытку обмануть нейронную сеть, предоставляя ей текст, который напоминал юмористическое предложение, но на самом деле был несмешным. Манипуляция заключалась в использовании аналогичной структуры предложения, но с заменой каламбура неюмористическим словом. Цель заключалась в том, чтобы увидеть, насколько легко сеть можно обмануть и будет ли она по-прежнему воспринимать юмор там, где его нет. Чем более устойчивой была сеть к такой обманной тактике, тем выше считалась ее стабильность.
Модели прошли обучение с использованием различных наборов данных по распознаванию юмора, а также комбинаций таких наборов. Кроме того, исследователи провели тесты, используя диалоги, извлеченные из известных литературных произведений, таких как «Алиса в стране чудес» Льюиса Кэрролла, «Лавка древностей» Чарльза Диккенса и «Трое в лодке, не считая собаки» Джерома К. Джерома. Кроме того, модели оценивались с использованием диалогов из популярных телешоу, таких как «Ходячие мертвецы» и «Друзья», а также подборки саркастических твитов.
При проведении эксперимента с различными моделями выяснилось, что некоторые модели были чрезмерно тренированы и имели склонность воспринимать все как юмористическое. Чтобы оценить их понимание, этим моделям был представлен знаменитый роман Чарльза Диккенса «Лавка древностей», широко известный своим меланхоличным повествованием. Удивительно, но было замечено, что часть моделей придерживалась убеждения, что все диалоги, заимствованные из литературы XIX века, по своей сути комичны. Более того, эти модели даже расширили свое восприятие юмора, включив в него любой контент, который значительно отличается от современных новостей 21 века.
Использование моделей, обученных игре слов, показало тенденцию к увеличению количества ошибок, когда одно слово в несмешном тексте заменяется согласной. Кроме того, исследования показали, что нейронные сети, обученные на меньших порциях данных, демонстрируют большую способность понимать юмор по сравнению с теми, которые обучены на больших объемах тех же данных. Эти результаты привели авторов к выводу, что нынешним наборам данных не хватает широты, что приводит к ограниченному представлению юмора и, в конечном итоге, ставит под угрозу точность распознавания шуток.
Чтобы повысить эффективность моделей распознавания юмора, исследователи выдвинули предложение изменить существующие методы обучения и оценки. Они утверждают, что существующим наборам данных не хватает разнообразия и они не могут точно отражать повседневные разговоры и естественное общение. Чтобы исправить это, необходимо разработать новые наборы данных, охватывающие более широкий спектр контекстов и взаимодействий. Одним из многообещающих направлений является использование больших языковых моделей, таких как ChatGPT, которые были обучены на огромных объемах разнообразных данных. Эти модели продемонстрировали похвальные результаты в распознавании юмора, что побудило ученых предположить, что их успех обусловлен обширным набором данных, на которых они обучались.
Сегодня внимание ученых сосредоточено исключительно на бинарном распознавании юмора, то есть категоризации шуток: либо смешно, либо не смешно. Предстоит пройти еще долгий путь, прежде чем машина сможет определить различные оттенки юмора, различать сарказм и иронию и точно детектировать ситуативный и контекстуальный юмор. В настоящее время голосовые помощники полагаются на заранее запрограммированные ответы, которые фильтруются на основе слов пользователя, чтобы определить, какую шутку произнести. К сожалению, эти запрограммированные реакции часто кажутся искусственными и лишены желаемой естественности. Потребность в искусственном интеллекте, способном проявить большую человечность, очевидна, но удовлетворение этого требования, несомненно, будет непростой задачей.
Исследование показало, что для повышения точности и эффективности распознавания юмора необходимо изменить текущую методологию, используемую при разработке наборов данных, используемых для обучения этих сетей.
С середины 2000-х годов ученые посвятили свои исследования распознаванию юмора, уделяя особое внимание классификации шуток на смешные и несмешные. Для проведения этих исследований исследователи собирали и маркировали наборы данных в рамках стандартизированной структуры. Однако группа ученых из Высшей школы экономики предложила новый подход к построению таких наборов данных. Их идея состоит в том, чтобы сделать их более разнообразными, тем самым гарантируя, что они не будут ограничиваться определенным типом юмора.
Кроме того, они утверждают, что размер наборов данных не обязательно должен быть большим для достижения точных результатов. В настоящее время голосовые помощники способны только цитировать готовые шутки и не имеют возможности создавать собственные или распознавать юмористические интонации в тексте. Однако пользователи голосовых помощников на базе искусственного интеллекта требуют более человеческого взаимодействия, включая возможность распознавать и создавать объекты юмора.
Распознать юмор может быть довольно сложно из-за отсутствия формальных стандартов, позволяющих определить, что считать смешным, а что нет. В настоящее время большинство наборов данных, используемых для обучения и оценки моделей распознавания юмора, преимущественно состоят из каламбуров. Однако обнаружить сарказм и иронию еще сложнее, как и уловить ситуационный юмор, который требует понимания окружающего контекста или культурных норм.
По словам доцента факультета компьютерных наук Высшей школы экономики Павла Браславского, основной задачей ученых было оценить переносимость и стабильность моделей, прошедших обучение на различных наборах данных. В случае переносимости речь идет о том, насколько эффективно модель, обученная на определенном наборе данных с определенным типом юмора, может точно идентифицировать и понимать другой тип юмора. Сложность проведения такой оценки заключается в том, что юмор может проявляться в разных формах и вариациях, что затрудняет прогнозирование того, как будет разворачиваться тренировочный процесс.
Чтобы оценить стабильность нейронной сети, ученые провели эксперименты с использованием «состязательных атак». Эти атаки включали преднамеренную попытку обмануть нейронную сеть, предоставляя ей текст, который напоминал юмористическое предложение, но на самом деле был несмешным. Манипуляция заключалась в использовании аналогичной структуры предложения, но с заменой каламбура неюмористическим словом. Цель заключалась в том, чтобы увидеть, насколько легко сеть можно обмануть и будет ли она по-прежнему воспринимать юмор там, где его нет. Чем более устойчивой была сеть к такой обманной тактике, тем выше считалась ее стабильность.
Модели прошли обучение с использованием различных наборов данных по распознаванию юмора, а также комбинаций таких наборов. Кроме того, исследователи провели тесты, используя диалоги, извлеченные из известных литературных произведений, таких как «Алиса в стране чудес» Льюиса Кэрролла, «Лавка древностей» Чарльза Диккенса и «Трое в лодке, не считая собаки» Джерома К. Джерома. Кроме того, модели оценивались с использованием диалогов из популярных телешоу, таких как «Ходячие мертвецы» и «Друзья», а также подборки саркастических твитов.
При проведении эксперимента с различными моделями выяснилось, что некоторые модели были чрезмерно тренированы и имели склонность воспринимать все как юмористическое. Чтобы оценить их понимание, этим моделям был представлен знаменитый роман Чарльза Диккенса «Лавка древностей», широко известный своим меланхоличным повествованием. Удивительно, но было замечено, что часть моделей придерживалась убеждения, что все диалоги, заимствованные из литературы XIX века, по своей сути комичны. Более того, эти модели даже расширили свое восприятие юмора, включив в него любой контент, который значительно отличается от современных новостей 21 века.
Использование моделей, обученных игре слов, показало тенденцию к увеличению количества ошибок, когда одно слово в несмешном тексте заменяется согласной. Кроме того, исследования показали, что нейронные сети, обученные на меньших порциях данных, демонстрируют большую способность понимать юмор по сравнению с теми, которые обучены на больших объемах тех же данных. Эти результаты привели авторов к выводу, что нынешним наборам данных не хватает широты, что приводит к ограниченному представлению юмора и, в конечном итоге, ставит под угрозу точность распознавания шуток.
Чтобы повысить эффективность моделей распознавания юмора, исследователи выдвинули предложение изменить существующие методы обучения и оценки. Они утверждают, что существующим наборам данных не хватает разнообразия и они не могут точно отражать повседневные разговоры и естественное общение. Чтобы исправить это, необходимо разработать новые наборы данных, охватывающие более широкий спектр контекстов и взаимодействий. Одним из многообещающих направлений является использование больших языковых моделей, таких как ChatGPT, которые были обучены на огромных объемах разнообразных данных. Эти модели продемонстрировали похвальные результаты в распознавании юмора, что побудило ученых предположить, что их успех обусловлен обширным набором данных, на которых они обучались.
Сегодня внимание ученых сосредоточено исключительно на бинарном распознавании юмора, то есть категоризации шуток: либо смешно, либо не смешно. Предстоит пройти еще долгий путь, прежде чем машина сможет определить различные оттенки юмора, различать сарказм и иронию и точно детектировать ситуативный и контекстуальный юмор. В настоящее время голосовые помощники полагаются на заранее запрограммированные ответы, которые фильтруются на основе слов пользователя, чтобы определить, какую шутку произнести. К сожалению, эти запрограммированные реакции часто кажутся искусственными и лишены желаемой естественности. Потребность в искусственном интеллекте, способном проявить большую человечность, очевидна, но удовлетворение этого требования, несомненно, будет непростой задачей.
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Раскрыта главная тайна антарктического льда: ученые узнали, как и кем была взломана природная защита Шестого континента
Похоже, той Антарктиде, которую мы знаем, приходит конец. Впрочем, это не точно...
Древнеримский артефакт переписывает историю Америки: Колумб был не первым?
Почему находка из индейской могилы почти 100 лет вызывает ожесточенные споры среди археологов и историков?...
Еще раз об убийстве Андрея Боголюбского: что рассказали кости погибшего князя?
Профессор судебной медицины поправил историков и выявил неточности древних летописей...
Тайна гибели сибирского «Титаника»: почему некоторые детали катастрофы 1921 года неизвестны даже сейчас?
Поразительно, но тогда судьи единогласно оправдали капитана парохода. Так кто же тогда был виновником этого страшного происшествия?...
Японец 26 лет ждал, пока раскроют убийство его жены. Часть 2. Расплата
Как наука отменила срок давности у преступления? И какая тайна осталась не раскрытой?...
Японец 26 лет ждал, пока раскроют убийство его жены
Как новейшие технологии помогли сдвинуть с места нераскрываемое дело...
Жители Анд переписали свою ДНК: почему горные индейцы пьют ядовитую воду, но чувствуют себя при этом хорошо?
По словам ученых, эволюция сделала красивый и хитрый ход. И это не иммунитет к токсинам, а нечто другое, более интересное...
Ядерный взрыв на Луне: для чего советские ученые хотели провести такой грандиозный эксперимент?
Зачем России атомный реактор на Луне и как он поможет нам добраться до Венеры?...
ФСБ рассекретило часть архивов Александра Вадиса, генерала «Смерш»: как советская контрразведка переиграла немцев на Курской дуге. И не только
Историки говорят: по биографии этого смершевца можно запросто снять несколько остросюжетных боевиков...
Почему эти меры не спасут Антарктиду: пять проектов по спасению ледников оказались провалом
Эксперт жестко проанализировал самые популярные программы по сохранению льда на Шестом континенте. Увы, они оказались невыполнимой фантастикой, причем опасно...