
Нешуточная задача: Российские ученые обучают ИИ чувству юмора
Комплексное исследование способности нейронных сетей распознавать и понимать юмор провела команда ученых с факультета компьютерных наук Национального исследовательского университета «Высшая школа экономики». Исследование проведено в рамках проекта «Научно-учебная лаборатория моделей и методов вычислительной прагматики». Александр Баранов, аспирант факультета компьютерных наук НИУ ВШЭ, представил результаты на конференции, проходящей в Сингапуре. Финансовую поддержку его участия в мероприятии оказал Национальный исследовательский университет «Высшая школа экономики».
Исследование показало, что для повышения точности и эффективности распознавания юмора необходимо изменить текущую методологию, используемую при разработке наборов данных, используемых для обучения этих сетей.
С середины 2000-х годов ученые посвятили свои исследования распознаванию юмора, уделяя особое внимание классификации шуток на смешные и несмешные. Для проведения этих исследований исследователи собирали и маркировали наборы данных в рамках стандартизированной структуры. Однако группа ученых из Высшей школы экономики предложила новый подход к построению таких наборов данных. Их идея состоит в том, чтобы сделать их более разнообразными, тем самым гарантируя, что они не будут ограничиваться определенным типом юмора.
Кроме того, они утверждают, что размер наборов данных не обязательно должен быть большим для достижения точных результатов. В настоящее время голосовые помощники способны только цитировать готовые шутки и не имеют возможности создавать собственные или распознавать юмористические интонации в тексте. Однако пользователи голосовых помощников на базе искусственного интеллекта требуют более человеческого взаимодействия, включая возможность распознавать и создавать объекты юмора.
Распознать юмор может быть довольно сложно из-за отсутствия формальных стандартов, позволяющих определить, что считать смешным, а что нет. В настоящее время большинство наборов данных, используемых для обучения и оценки моделей распознавания юмора, преимущественно состоят из каламбуров. Однако обнаружить сарказм и иронию еще сложнее, как и уловить ситуационный юмор, который требует понимания окружающего контекста или культурных норм.
По словам доцента факультета компьютерных наук Высшей школы экономики Павла Браславского, основной задачей ученых было оценить переносимость и стабильность моделей, прошедших обучение на различных наборах данных. В случае переносимости речь идет о том, насколько эффективно модель, обученная на определенном наборе данных с определенным типом юмора, может точно идентифицировать и понимать другой тип юмора. Сложность проведения такой оценки заключается в том, что юмор может проявляться в разных формах и вариациях, что затрудняет прогнозирование того, как будет разворачиваться тренировочный процесс.
Чтобы оценить стабильность нейронной сети, ученые провели эксперименты с использованием «состязательных атак». Эти атаки включали преднамеренную попытку обмануть нейронную сеть, предоставляя ей текст, который напоминал юмористическое предложение, но на самом деле был несмешным. Манипуляция заключалась в использовании аналогичной структуры предложения, но с заменой каламбура неюмористическим словом. Цель заключалась в том, чтобы увидеть, насколько легко сеть можно обмануть и будет ли она по-прежнему воспринимать юмор там, где его нет. Чем более устойчивой была сеть к такой обманной тактике, тем выше считалась ее стабильность.
Модели прошли обучение с использованием различных наборов данных по распознаванию юмора, а также комбинаций таких наборов. Кроме того, исследователи провели тесты, используя диалоги, извлеченные из известных литературных произведений, таких как «Алиса в стране чудес» Льюиса Кэрролла, «Лавка древностей» Чарльза Диккенса и «Трое в лодке, не считая собаки» Джерома К. Джерома. Кроме того, модели оценивались с использованием диалогов из популярных телешоу, таких как «Ходячие мертвецы» и «Друзья», а также подборки саркастических твитов.
При проведении эксперимента с различными моделями выяснилось, что некоторые модели были чрезмерно тренированы и имели склонность воспринимать все как юмористическое. Чтобы оценить их понимание, этим моделям был представлен знаменитый роман Чарльза Диккенса «Лавка древностей», широко известный своим меланхоличным повествованием. Удивительно, но было замечено, что часть моделей придерживалась убеждения, что все диалоги, заимствованные из литературы XIX века, по своей сути комичны. Более того, эти модели даже расширили свое восприятие юмора, включив в него любой контент, который значительно отличается от современных новостей 21 века.
Использование моделей, обученных игре слов, показало тенденцию к увеличению количества ошибок, когда одно слово в несмешном тексте заменяется согласной. Кроме того, исследования показали, что нейронные сети, обученные на меньших порциях данных, демонстрируют большую способность понимать юмор по сравнению с теми, которые обучены на больших объемах тех же данных. Эти результаты привели авторов к выводу, что нынешним наборам данных не хватает широты, что приводит к ограниченному представлению юмора и, в конечном итоге, ставит под угрозу точность распознавания шуток.
Чтобы повысить эффективность моделей распознавания юмора, исследователи выдвинули предложение изменить существующие методы обучения и оценки. Они утверждают, что существующим наборам данных не хватает разнообразия и они не могут точно отражать повседневные разговоры и естественное общение. Чтобы исправить это, необходимо разработать новые наборы данных, охватывающие более широкий спектр контекстов и взаимодействий. Одним из многообещающих направлений является использование больших языковых моделей, таких как ChatGPT, которые были обучены на огромных объемах разнообразных данных. Эти модели продемонстрировали похвальные результаты в распознавании юмора, что побудило ученых предположить, что их успех обусловлен обширным набором данных, на которых они обучались.
Сегодня внимание ученых сосредоточено исключительно на бинарном распознавании юмора, то есть категоризации шуток: либо смешно, либо не смешно. Предстоит пройти еще долгий путь, прежде чем машина сможет определить различные оттенки юмора, различать сарказм и иронию и точно детектировать ситуативный и контекстуальный юмор. В настоящее время голосовые помощники полагаются на заранее запрограммированные ответы, которые фильтруются на основе слов пользователя, чтобы определить, какую шутку произнести. К сожалению, эти запрограммированные реакции часто кажутся искусственными и лишены желаемой естественности. Потребность в искусственном интеллекте, способном проявить большую человечность, очевидна, но удовлетворение этого требования, несомненно, будет непростой задачей.
Исследование показало, что для повышения точности и эффективности распознавания юмора необходимо изменить текущую методологию, используемую при разработке наборов данных, используемых для обучения этих сетей.
С середины 2000-х годов ученые посвятили свои исследования распознаванию юмора, уделяя особое внимание классификации шуток на смешные и несмешные. Для проведения этих исследований исследователи собирали и маркировали наборы данных в рамках стандартизированной структуры. Однако группа ученых из Высшей школы экономики предложила новый подход к построению таких наборов данных. Их идея состоит в том, чтобы сделать их более разнообразными, тем самым гарантируя, что они не будут ограничиваться определенным типом юмора.
Кроме того, они утверждают, что размер наборов данных не обязательно должен быть большим для достижения точных результатов. В настоящее время голосовые помощники способны только цитировать готовые шутки и не имеют возможности создавать собственные или распознавать юмористические интонации в тексте. Однако пользователи голосовых помощников на базе искусственного интеллекта требуют более человеческого взаимодействия, включая возможность распознавать и создавать объекты юмора.
Распознать юмор может быть довольно сложно из-за отсутствия формальных стандартов, позволяющих определить, что считать смешным, а что нет. В настоящее время большинство наборов данных, используемых для обучения и оценки моделей распознавания юмора, преимущественно состоят из каламбуров. Однако обнаружить сарказм и иронию еще сложнее, как и уловить ситуационный юмор, который требует понимания окружающего контекста или культурных норм.
По словам доцента факультета компьютерных наук Высшей школы экономики Павла Браславского, основной задачей ученых было оценить переносимость и стабильность моделей, прошедших обучение на различных наборах данных. В случае переносимости речь идет о том, насколько эффективно модель, обученная на определенном наборе данных с определенным типом юмора, может точно идентифицировать и понимать другой тип юмора. Сложность проведения такой оценки заключается в том, что юмор может проявляться в разных формах и вариациях, что затрудняет прогнозирование того, как будет разворачиваться тренировочный процесс.
Чтобы оценить стабильность нейронной сети, ученые провели эксперименты с использованием «состязательных атак». Эти атаки включали преднамеренную попытку обмануть нейронную сеть, предоставляя ей текст, который напоминал юмористическое предложение, но на самом деле был несмешным. Манипуляция заключалась в использовании аналогичной структуры предложения, но с заменой каламбура неюмористическим словом. Цель заключалась в том, чтобы увидеть, насколько легко сеть можно обмануть и будет ли она по-прежнему воспринимать юмор там, где его нет. Чем более устойчивой была сеть к такой обманной тактике, тем выше считалась ее стабильность.
Модели прошли обучение с использованием различных наборов данных по распознаванию юмора, а также комбинаций таких наборов. Кроме того, исследователи провели тесты, используя диалоги, извлеченные из известных литературных произведений, таких как «Алиса в стране чудес» Льюиса Кэрролла, «Лавка древностей» Чарльза Диккенса и «Трое в лодке, не считая собаки» Джерома К. Джерома. Кроме того, модели оценивались с использованием диалогов из популярных телешоу, таких как «Ходячие мертвецы» и «Друзья», а также подборки саркастических твитов.
При проведении эксперимента с различными моделями выяснилось, что некоторые модели были чрезмерно тренированы и имели склонность воспринимать все как юмористическое. Чтобы оценить их понимание, этим моделям был представлен знаменитый роман Чарльза Диккенса «Лавка древностей», широко известный своим меланхоличным повествованием. Удивительно, но было замечено, что часть моделей придерживалась убеждения, что все диалоги, заимствованные из литературы XIX века, по своей сути комичны. Более того, эти модели даже расширили свое восприятие юмора, включив в него любой контент, который значительно отличается от современных новостей 21 века.
Использование моделей, обученных игре слов, показало тенденцию к увеличению количества ошибок, когда одно слово в несмешном тексте заменяется согласной. Кроме того, исследования показали, что нейронные сети, обученные на меньших порциях данных, демонстрируют большую способность понимать юмор по сравнению с теми, которые обучены на больших объемах тех же данных. Эти результаты привели авторов к выводу, что нынешним наборам данных не хватает широты, что приводит к ограниченному представлению юмора и, в конечном итоге, ставит под угрозу точность распознавания шуток.
Чтобы повысить эффективность моделей распознавания юмора, исследователи выдвинули предложение изменить существующие методы обучения и оценки. Они утверждают, что существующим наборам данных не хватает разнообразия и они не могут точно отражать повседневные разговоры и естественное общение. Чтобы исправить это, необходимо разработать новые наборы данных, охватывающие более широкий спектр контекстов и взаимодействий. Одним из многообещающих направлений является использование больших языковых моделей, таких как ChatGPT, которые были обучены на огромных объемах разнообразных данных. Эти модели продемонстрировали похвальные результаты в распознавании юмора, что побудило ученых предположить, что их успех обусловлен обширным набором данных, на которых они обучались.
Сегодня внимание ученых сосредоточено исключительно на бинарном распознавании юмора, то есть категоризации шуток: либо смешно, либо не смешно. Предстоит пройти еще долгий путь, прежде чем машина сможет определить различные оттенки юмора, различать сарказм и иронию и точно детектировать ситуативный и контекстуальный юмор. В настоящее время голосовые помощники полагаются на заранее запрограммированные ответы, которые фильтруются на основе слов пользователя, чтобы определить, какую шутку произнести. К сожалению, эти запрограммированные реакции часто кажутся искусственными и лишены желаемой естественности. Потребность в искусственном интеллекте, способном проявить большую человечность, очевидна, но удовлетворение этого требования, несомненно, будет непростой задачей.
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас

Еще раз о ядерной войне на Марсе
Гипотетический конфликт на Красной планете не дает покоя некоторым ученым....

В мозгах спецназовцев обнаружились скрытые аномалии
Новейшее исследование показало, что обычный МРТ вообще не видит некоторые травмы головы....

Причина необъяснимых нападений морских львов на людей наконец-то раскрыта
Все дело в редком токсине, который заполонил прибрежные воды Калифорнии....

Ужасное наводнение создало Средиземное море всего за несколько месяцев
Потоп мчался со скоростью 115 километров в час....

Властелины огня: как древние люди поддерживали пламя в самые холодные времена
Основным топливом была древесина ели....

Термоядерный двигатель доставит людей до Марса всего за три месяца
Новая эра космических исследований вот-вот начнется?...

А фиолетовый-то, говорят… ненастоящий!
Ученые доказали, что этот цвет — иллюзия, существующая лишь у нас в голове....

Общий наркоз стирает уникальность головного мозга
Открытие поможет выводить пациентов из комы....

Археологи обнаружили в Египте 3400-летний затерянный город
Самое поразительное: он скрывался… под руинами древнегреческого некрополя....

Стало известно, как Земля «выкачала» воду с обратной стороны Луны
Сенсацию принес аппарат китайской миссии «Чанъэ-6»....

Новое исследование показало: мягкие игрушки — самые опасные вещи в доме
Микробов в этих предметах оказалось вдвое больше, чем на сиденье унитаза....

Ещё одна бесценная находка: челюсть с берегов Тайваня принадлежала денисовцу
Загадка не давала покоя несколько лет....

Выяснилось, что суша вокруг Аральского моря... стремительно поднимается
И ученые сумели разгадать эту удивительную загадку природы....

Раскрыт секрет: почему самые древние метеориты не долетают до Земли
Против само Солнце, но это не единственная причина....

Зачем археологи измерили и сравнили размеры 50 000 древних домов
Общественное расслоение нельзя считать неизбежным....

Обнаружен гриб, который содержит самое горькое на свете вещество
Эксперты рассказали, почему это сладкая находка для науки....