Специалисты научились распознавать созданные ИИ короткие тексты
Специалисты из Колумбийского университета в городе Нью-Йорк (Columbia Engineering) научились отличать сгенерированные искусственным интеллектом (ИИ) тексты, даже очень короткие.
Профессора компьютерных наук Цзюньфэн Янг и Карл Вондрик назвали программный продукт Raidar, сократив таким образом словосочетание geneRative AI Detection viA Rewriting, что можно перевести как «Генеративное обнаружение искусственного интеллекта посредством переписывания». Разработка претендует на инновационный подход к различению написанного человеком и сгенерированным ИИ или большой языковой моделью (LLM), такими как ChatGPT. Важная оговорка: для этого Raidar не нужен доступ к архитектуре, алгоритмам или обучающим данным ИИ.
Исследователи использовали уникальную характеристику LLM, которую они называют «упрямством». Дело в том, что LLM свойственно изменять написанный человеком текст гораздо активнее, чем сгенерированный ИИ. Это происходит потому, что LLM часто воспринимают сгенерированное ИИ как нечто близкое к совершенству, а потому вносят в порождение нечеловеческого «разума» очень мало правок.
Raidar использует языковую модель, чтобы перефразировать проверяемый текст. А затем программе остаётся подсчитать, сколько в него внесено правок. Raidar, предлагает LLM переписать, например, сообщение из соцсетей, обзор товара или блогерскую запись. LLM выдаёт результат, и Raidar сравнивает исходный текст с обработанным компьютером. Множество правок означает высокую вероятность того, что оригинал был написан человеком. А вот если в исходный текст внесено мало изменений, то это даёт уверенность — его создавала машина.
Точность Raidar очень высока, так как превосходит предыдущие методы на 29%. Прорыв в производительности достигнут благодаря передовым LLM. Причём Raidar отличается высокой точностью даже при анализе коротких текстов. Разработчики считают достигнутое значительным прорывом, поскольку прежним технологиям требовались для сверки куда более длинные тексты.
Точность крайне важна для разоблачения созданных ИИ коротких текстов. Очень важно определять подлинность, например, сообщений и комментариев в соцсетях, так как они могут повлиять на широкую общественность.
Разработчики намерены продолжить свой исследовательский проект, чтобы охватить им контент на разных языках, включая языки программирования. В сферу их интересов также входит распознавание созданных ИИ изображений, видео и аудио, причём на самых разных носителях.
Профессора компьютерных наук Цзюньфэн Янг и Карл Вондрик назвали программный продукт Raidar, сократив таким образом словосочетание geneRative AI Detection viA Rewriting, что можно перевести как «Генеративное обнаружение искусственного интеллекта посредством переписывания». Разработка претендует на инновационный подход к различению написанного человеком и сгенерированным ИИ или большой языковой моделью (LLM), такими как ChatGPT. Важная оговорка: для этого Raidar не нужен доступ к архитектуре, алгоритмам или обучающим данным ИИ.
Исследователи использовали уникальную характеристику LLM, которую они называют «упрямством». Дело в том, что LLM свойственно изменять написанный человеком текст гораздо активнее, чем сгенерированный ИИ. Это происходит потому, что LLM часто воспринимают сгенерированное ИИ как нечто близкое к совершенству, а потому вносят в порождение нечеловеческого «разума» очень мало правок.
Raidar использует языковую модель, чтобы перефразировать проверяемый текст. А затем программе остаётся подсчитать, сколько в него внесено правок. Raidar, предлагает LLM переписать, например, сообщение из соцсетей, обзор товара или блогерскую запись. LLM выдаёт результат, и Raidar сравнивает исходный текст с обработанным компьютером. Множество правок означает высокую вероятность того, что оригинал был написан человеком. А вот если в исходный текст внесено мало изменений, то это даёт уверенность — его создавала машина.
Точность Raidar очень высока, так как превосходит предыдущие методы на 29%. Прорыв в производительности достигнут благодаря передовым LLM. Причём Raidar отличается высокой точностью даже при анализе коротких текстов. Разработчики считают достигнутое значительным прорывом, поскольку прежним технологиям требовались для сверки куда более длинные тексты.
Точность крайне важна для разоблачения созданных ИИ коротких текстов. Очень важно определять подлинность, например, сообщений и комментариев в соцсетях, так как они могут повлиять на широкую общественность.
Разработчики намерены продолжить свой исследовательский проект, чтобы охватить им контент на разных языках, включая языки программирования. В сферу их интересов также входит распознавание созданных ИИ изображений, видео и аудио, причём на самых разных носителях.
- Дмитрий Ладыгин
- youtu.be/NXeIPwpRJrw
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Искали золото в Австралии, а обнаружили следы взрыва тысяч атомных бомб
Почему находка древней катастрофы сильно продвинуло исследование Марса?...
Секреты «русского гена»: о чем молчит гаплогруппа R1a1?
67 общих маркеров ДНК: половина современных русских мужчин и две трети мужчин из высших каст Северной Индии происходят от одного предка. И не только......
Если высохнет Каспий: почему это особенно опасно для России?
Прогнозы пугают: уникальное море-озеро может уменьшиться почти на 40%. И это катастрофа...
Непотушенный окурок взорвал целый город: чудовищная катастрофа и чудовищная ложь в США
Почему власти десятилетиями умалчивали истинную причину самого мощного техногенного ЧП в истории Штатов?...
Третий сын Сталина: родство подтвердил уникальный документ из Красноярского архива
Будущий вождь обещал жениться, но судьба и история оказались против этого брака...
Гениально, многоэтажно и смертельно опасно: как римляне научились строить высотные дома
Почему реальный Древний Рим выглядел вообще не так, как нам показывают в исторических фильмах?...
Почему индейцы — родственники россиян: что нашли в ДНК коренных американцев?
Как связан древний мальчик с Байкала с племенем в Амазонии? Какой подарок от древних людей помог заселить Америку?...
«Код» таинственной золотой подводной сферы наконец-то взломан спустя три года
Ученые говорят: это был настоящий ДНК-детектив. Внеземная «капсула» оказалась «деталью» морского гиганта...
Первый раз настоящий сахар нашли в космосе: почему ученые в восторге?
Чем космический сахар отличается от земного? И почему биологи говорят, что это сенсация?...
Тайный алтарь на развалинах мертвого города майя обнаружили археологи
Выяснилось, что индейцы долгие столетия продолжали исповедовать, казалось бы, давно забытый древний культ...
За что Владимир Ленин трижды выдвигался на Нобелевскую премию?
Почему самая большая «мирная» награда так и не дошла до главного большевика?...