Специалисты научились распознавать созданные ИИ короткие тексты
Специалисты из Колумбийского университета в городе Нью-Йорк (Columbia Engineering) научились отличать сгенерированные искусственным интеллектом (ИИ) тексты, даже очень короткие.
Профессора компьютерных наук Цзюньфэн Янг и Карл Вондрик назвали программный продукт Raidar, сократив таким образом словосочетание geneRative AI Detection viA Rewriting, что можно перевести как «Генеративное обнаружение искусственного интеллекта посредством переписывания». Разработка претендует на инновационный подход к различению написанного человеком и сгенерированным ИИ или большой языковой моделью (LLM), такими как ChatGPT. Важная оговорка: для этого Raidar не нужен доступ к архитектуре, алгоритмам или обучающим данным ИИ.
Исследователи использовали уникальную характеристику LLM, которую они называют «упрямством». Дело в том, что LLM свойственно изменять написанный человеком текст гораздо активнее, чем сгенерированный ИИ. Это происходит потому, что LLM часто воспринимают сгенерированное ИИ как нечто близкое к совершенству, а потому вносят в порождение нечеловеческого «разума» очень мало правок.
Raidar использует языковую модель, чтобы перефразировать проверяемый текст. А затем программе остаётся подсчитать, сколько в него внесено правок. Raidar, предлагает LLM переписать, например, сообщение из соцсетей, обзор товара или блогерскую запись. LLM выдаёт результат, и Raidar сравнивает исходный текст с обработанным компьютером. Множество правок означает высокую вероятность того, что оригинал был написан человеком. А вот если в исходный текст внесено мало изменений, то это даёт уверенность — его создавала машина.
Точность Raidar очень высока, так как превосходит предыдущие методы на 29%. Прорыв в производительности достигнут благодаря передовым LLM. Причём Raidar отличается высокой точностью даже при анализе коротких текстов. Разработчики считают достигнутое значительным прорывом, поскольку прежним технологиям требовались для сверки куда более длинные тексты.
Точность крайне важна для разоблачения созданных ИИ коротких текстов. Очень важно определять подлинность, например, сообщений и комментариев в соцсетях, так как они могут повлиять на широкую общественность.
Разработчики намерены продолжить свой исследовательский проект, чтобы охватить им контент на разных языках, включая языки программирования. В сферу их интересов также входит распознавание созданных ИИ изображений, видео и аудио, причём на самых разных носителях.
Профессора компьютерных наук Цзюньфэн Янг и Карл Вондрик назвали программный продукт Raidar, сократив таким образом словосочетание geneRative AI Detection viA Rewriting, что можно перевести как «Генеративное обнаружение искусственного интеллекта посредством переписывания». Разработка претендует на инновационный подход к различению написанного человеком и сгенерированным ИИ или большой языковой моделью (LLM), такими как ChatGPT. Важная оговорка: для этого Raidar не нужен доступ к архитектуре, алгоритмам или обучающим данным ИИ.
Исследователи использовали уникальную характеристику LLM, которую они называют «упрямством». Дело в том, что LLM свойственно изменять написанный человеком текст гораздо активнее, чем сгенерированный ИИ. Это происходит потому, что LLM часто воспринимают сгенерированное ИИ как нечто близкое к совершенству, а потому вносят в порождение нечеловеческого «разума» очень мало правок.
Raidar использует языковую модель, чтобы перефразировать проверяемый текст. А затем программе остаётся подсчитать, сколько в него внесено правок. Raidar, предлагает LLM переписать, например, сообщение из соцсетей, обзор товара или блогерскую запись. LLM выдаёт результат, и Raidar сравнивает исходный текст с обработанным компьютером. Множество правок означает высокую вероятность того, что оригинал был написан человеком. А вот если в исходный текст внесено мало изменений, то это даёт уверенность — его создавала машина.
Точность Raidar очень высока, так как превосходит предыдущие методы на 29%. Прорыв в производительности достигнут благодаря передовым LLM. Причём Raidar отличается высокой точностью даже при анализе коротких текстов. Разработчики считают достигнутое значительным прорывом, поскольку прежним технологиям требовались для сверки куда более длинные тексты.
Точность крайне важна для разоблачения созданных ИИ коротких текстов. Очень важно определять подлинность, например, сообщений и комментариев в соцсетях, так как они могут повлиять на широкую общественность.
Разработчики намерены продолжить свой исследовательский проект, чтобы охватить им контент на разных языках, включая языки программирования. В сферу их интересов также входит распознавание созданных ИИ изображений, видео и аудио, причём на самых разных носителях.
- Дмитрий Ладыгин
- youtu.be/NXeIPwpRJrw
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
«Цирк Шубикова» с бомбами: как в СССР создали «невозможный» авианосец
Самолеты атаковали противника, срываясь с летающей авиабазы. Это пытались сделать и США, и Германия, но получилось только у Советского Союза...
Медный парадокс: почему электричество никогда не придет в каждый дом
Эксперты считают, что развитие цивилизации уперлось в мощный геологический барьер. Кто виноват и как выходить из этой ситуации?...
Новое исследование: Христофор Колумб — вообще не тот, кем его считали историки
Ученые даже назвали подлинное имя великого мореплавателя...
Еще одна тайна Аркаима разгадана: ученые объяснили, почему древний город построен именно на этом месте
Оказалось, что наши далекие предки очень умело использовали природную инфраструктуру и обладали инженерными знаниями...
Что за звуки сводили с ума смотрителей маяков: тайна разгадана учеными
Эксперты из Института поиска внеземного разума говорят: новое открытие в буквальном смысле открыло им глаза и уши...
60 млрд Солнц в одной точке: что скрывает самая тяжелая пара черных дыр?
Секрет абсолютной пустоты, похоже, разгадан. Там нет вообще ничего: Ни пыли, ни газа, ни звезд...
Назад в будущее: почему Швеция запрещает смартфоны в школах и возвращается к бумажным учебникам?
По словам экспертов, отмена цифровизации сейчас происходит во многих странах. Неужели человечество одумалось и начинает выздоравливать?...
Трехметровые осетры и тайна древнего русского города: историки раскрыли, как появилась Старая Ладога
Ответы на многие вопросы дали… 67 000 костей. Иногда, чтобы распутать исторический детектив, надо заглядывать не в хроники, а в мусорные кучи...
В тени российского орла: сколько раз Петербург спасал Вашингтон от полной гибели?
Когда-то американцы клялись, что США будет дружить с Россией, покуда светят звезды. А сейчас делают вид, что не помнят...
4600-летний секрет «неубиваемости» Великой пирамиды раскрыт: все дело в специальных камерах
Древние инженеры опередили время на тысячелетия. Строение находится на своей частоте и гасит внешние вибрации...
Мы все «марсиане»: ученые доказали, что жизнь с Красной планеты могла долететь за несколько лет
Компьютерное моделирование подтвердило: бактерии способны пережить Великий перенос с Марса на Землю. И этот процесс может идти прямо сейчас...
СССР был первым в энергии ветра: что помешало стать лидером планеты?
Это был невероятный и прорывной проект советского конструктора Юрия Кондратюка. Того самого, по расчетам которого, американцы полетели на Луну...
«Печать Евы»: почему у этих женщин рождаются только девочки
Оказалось, что старые теории вообще не работают. Но есть две мутации, которые могут усилить друг друга...