Специалисты научились распознавать созданные ИИ короткие тексты
Специалисты из Колумбийского университета в городе Нью-Йорк (Columbia Engineering) научились отличать сгенерированные искусственным интеллектом (ИИ) тексты, даже очень короткие.
Профессора компьютерных наук Цзюньфэн Янг и Карл Вондрик назвали программный продукт Raidar, сократив таким образом словосочетание geneRative AI Detection viA Rewriting, что можно перевести как «Генеративное обнаружение искусственного интеллекта посредством переписывания». Разработка претендует на инновационный подход к различению написанного человеком и сгенерированным ИИ или большой языковой моделью (LLM), такими как ChatGPT. Важная оговорка: для этого Raidar не нужен доступ к архитектуре, алгоритмам или обучающим данным ИИ.
Исследователи использовали уникальную характеристику LLM, которую они называют «упрямством». Дело в том, что LLM свойственно изменять написанный человеком текст гораздо активнее, чем сгенерированный ИИ. Это происходит потому, что LLM часто воспринимают сгенерированное ИИ как нечто близкое к совершенству, а потому вносят в порождение нечеловеческого «разума» очень мало правок.
Raidar использует языковую модель, чтобы перефразировать проверяемый текст. А затем программе остаётся подсчитать, сколько в него внесено правок. Raidar, предлагает LLM переписать, например, сообщение из соцсетей, обзор товара или блогерскую запись. LLM выдаёт результат, и Raidar сравнивает исходный текст с обработанным компьютером. Множество правок означает высокую вероятность того, что оригинал был написан человеком. А вот если в исходный текст внесено мало изменений, то это даёт уверенность — его создавала машина.
Точность Raidar очень высока, так как превосходит предыдущие методы на 29%. Прорыв в производительности достигнут благодаря передовым LLM. Причём Raidar отличается высокой точностью даже при анализе коротких текстов. Разработчики считают достигнутое значительным прорывом, поскольку прежним технологиям требовались для сверки куда более длинные тексты.
Точность крайне важна для разоблачения созданных ИИ коротких текстов. Очень важно определять подлинность, например, сообщений и комментариев в соцсетях, так как они могут повлиять на широкую общественность.
Разработчики намерены продолжить свой исследовательский проект, чтобы охватить им контент на разных языках, включая языки программирования. В сферу их интересов также входит распознавание созданных ИИ изображений, видео и аудио, причём на самых разных носителях.
Профессора компьютерных наук Цзюньфэн Янг и Карл Вондрик назвали программный продукт Raidar, сократив таким образом словосочетание geneRative AI Detection viA Rewriting, что можно перевести как «Генеративное обнаружение искусственного интеллекта посредством переписывания». Разработка претендует на инновационный подход к различению написанного человеком и сгенерированным ИИ или большой языковой моделью (LLM), такими как ChatGPT. Важная оговорка: для этого Raidar не нужен доступ к архитектуре, алгоритмам или обучающим данным ИИ.
Исследователи использовали уникальную характеристику LLM, которую они называют «упрямством». Дело в том, что LLM свойственно изменять написанный человеком текст гораздо активнее, чем сгенерированный ИИ. Это происходит потому, что LLM часто воспринимают сгенерированное ИИ как нечто близкое к совершенству, а потому вносят в порождение нечеловеческого «разума» очень мало правок.
Raidar использует языковую модель, чтобы перефразировать проверяемый текст. А затем программе остаётся подсчитать, сколько в него внесено правок. Raidar, предлагает LLM переписать, например, сообщение из соцсетей, обзор товара или блогерскую запись. LLM выдаёт результат, и Raidar сравнивает исходный текст с обработанным компьютером. Множество правок означает высокую вероятность того, что оригинал был написан человеком. А вот если в исходный текст внесено мало изменений, то это даёт уверенность — его создавала машина.
Точность Raidar очень высока, так как превосходит предыдущие методы на 29%. Прорыв в производительности достигнут благодаря передовым LLM. Причём Raidar отличается высокой точностью даже при анализе коротких текстов. Разработчики считают достигнутое значительным прорывом, поскольку прежним технологиям требовались для сверки куда более длинные тексты.
Точность крайне важна для разоблачения созданных ИИ коротких текстов. Очень важно определять подлинность, например, сообщений и комментариев в соцсетях, так как они могут повлиять на широкую общественность.
Разработчики намерены продолжить свой исследовательский проект, чтобы охватить им контент на разных языках, включая языки программирования. В сферу их интересов также входит распознавание созданных ИИ изображений, видео и аудио, причём на самых разных носителях.
- Дмитрий Ладыгин
- youtu.be/NXeIPwpRJrw
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Очередной миф Николая Карамзина полностью развеян российскими археологами
Оказалось, что Иван Грозный не убивал супругу своего младшего брата. Напротив, с княгиней Ульянией Углицкой случалась куда более таинственная и запутанная...
Самая запрещенная русская сказка: почему «Курочку Рябу» не любили ни цари, ни руководители СССР?
Чтобы эту историю можно было рассказывать советским детям, ее сюжет пришлось изменить самым радикальным образом. Но, может быть, это и к лучшему...
Раскрыта главная тайна антарктического льда: ученые узнали, как и кем была взломана природная защита Шестого континента
Похоже, той Антарктиде, которую мы знаем, приходит конец. Впрочем, это не точно...
Тайна гибели сибирского «Титаника»: почему некоторые детали катастрофы 1921 года неизвестны даже сейчас?
Поразительно, но тогда судьи единогласно оправдали капитана парохода. Так кто же тогда был виновником этого страшного происшествия?...
Японец 26 лет ждал, пока раскроют убийство его жены. Часть 2. Расплата
Как наука отменила срок давности у преступления? И какая тайна осталась не раскрытой?...
Гениальное ДНК-«мошенничество»: ученые раскрыли секрет рыбы, которая плевать хотела на главные законы биологии
100 000 лет успешного клонирования: амазонская моллинезия просто... копирует себя. И при этом удивительно успешно ремонтируют поврежденные гены, насмехаясь над...
Японец 26 лет ждал, пока раскроют убийство его жены
Как новейшие технологии помогли сдвинуть с места нераскрываемое дело...
Древнеримский артефакт переписывает историю Америки: Колумб был не первым?
Почему находка из индейской могилы почти 100 лет вызывает ожесточенные споры среди археологов и историков?...
Главный секрет человеческого дыхания: ученые рассказали, почему мы дышим «вахтовым методом»
Эксперты предупреждают: из-за особенности организма многие люди не смогут попасть в космос. Но решение все-таки есть...
43 000 черепков открыли тысячелетние тайны Древнего Египта
Почему глиняная библиотека Атрибиса потрясла весь археологический мир?...
Жители Анд переписали свою ДНК: почему горные индейцы пьют ядовитую воду, но чувствуют себя при этом хорошо?
По словам ученых, эволюция сделала красивый и хитрый ход. И это не иммунитет к токсинам, а нечто другое, более интересное...