Новый инструмент обнаруживает видео, созданные искусственным интеллектом, с точностью 93,7%
В этом году сотрудник многонациональной корпорации перевел мошенникам 25 млн долларов. Инструкции по переводу денег, как он думал, ему прислал финансовый директор компании. На самом деле преступники использовали программу искусственного интеллекта для создания реалистичных видеороликов с участием финдиректора и нескольких коллег бедолаги.
Видеоролики, созданные искусственным интеллектом, стали настолько реалистичными, что люди (и существующие системы обнаружения) испытывают трудности с различением настоящего и поддельного видео. Чтобы решить эту проблему, исследователи из Колумбийского инженерного факультета под руководством профессора компьютерных наук Чжунфэн Янга разработали новый инструмент для обнаружения видеороликов, созданных искусственным интеллектом.
Инструмент назвали DIVID (DIffusion-generated VIdeo Detector). Он расширяет проект команды, выпустившей ранее инструмент Raidar. Программа обнаруживает тексты, созданные искусственным интеллектом, анализируя их содержимое, без необходимости доступа к внутренним механизмам больших языковых моделей.
В первом столбце на фото: видеокадры с YouTube и фейковые видеоролики, созданные OpenAI из Sora. Во втором — кадры, восстановленные методом диффузии, а в конце отражены различия между первым и вторым столбцами.
DIRE (Ошибка реконструкции DIffusion) — это метод, который измеряет разницу между входным и соответствующим выходным изображением, восстановленным с помощью предварительно обученной диффузионной модели.
Как демонстрирует иллюстрация, реальные видеокадры имеют больше отличий от восстановленных кадров, чем от видео, созданного диффузией Это и является ключевым моментом для DIVID в обнаружении фальшивого видео.
DIVID обнаруживает новое поколение видеороликов, созданных генеративным искусственным интеллектом. Он улучшает существующие методы, которые эффективно выявляют видео, созданные старыми моделями ИИ, такими как генеративные антагонистические сети (GAN).
GAN — это система искусственного интеллекта с двумя нейронными сетями: одна создает фальшивые данные, а другая оценивает их, чтобы отличать поддельное от реального. Путем непрерывной обратной связи обе сети улучшаются, что приводит к высококачественному синтетическому видео, практически неотличимому от подлинного.
Текущие инструменты обнаружения искусственного интеллекта ищут характерные признаки — необычное расположение пикселей, ненатуральные движения или несоответствия между кадрами, которые обычно не возникают в реальных видео. Однако новое поколение инструментов с использованием диффузионной модели бросило вызов в области обнаружения фейков.
Raidar использует языковую модель для переформулирования или изменения текста, а затем измеряет количество правок, внесенных системой в исходный текст. Большое количество правок означает, что текст, скорее всего, написан человеком, в то время как меньшее число модификаций указывает на то, что текст, скорее всего, создан машиной.
— Янг.
Научная статья, включающая в себя открытый код и наборы данных, была представлена на конференции по компьютерному зрению и распознаванию образов (CVPR) в Сиэтле 18 июня 2024 года.
В настоящее время исследователи работают над улучшением платформы DIVID, чтобы она могла обрабатывать различные виды синтетических видео из инструментов создания видео с открытым исходным кодом. Они также используют DIVID для сбора видео для набора данных DIVID.
Видеоролики, созданные искусственным интеллектом, стали настолько реалистичными, что люди (и существующие системы обнаружения) испытывают трудности с различением настоящего и поддельного видео. Чтобы решить эту проблему, исследователи из Колумбийского инженерного факультета под руководством профессора компьютерных наук Чжунфэн Янга разработали новый инструмент для обнаружения видеороликов, созданных искусственным интеллектом.
Инструмент назвали DIVID (DIffusion-generated VIdeo Detector). Он расширяет проект команды, выпустившей ранее инструмент Raidar. Программа обнаруживает тексты, созданные искусственным интеллектом, анализируя их содержимое, без необходимости доступа к внутренним механизмам больших языковых моделей.
В первом столбце на фото: видеокадры с YouTube и фейковые видеоролики, созданные OpenAI из Sora. Во втором — кадры, восстановленные методом диффузии, а в конце отражены различия между первым и вторым столбцами.
DIRE (Ошибка реконструкции DIffusion) — это метод, который измеряет разницу между входным и соответствующим выходным изображением, восстановленным с помощью предварительно обученной диффузионной модели.
Как демонстрирует иллюстрация, реальные видеокадры имеют больше отличий от восстановленных кадров, чем от видео, созданного диффузией Это и является ключевым моментом для DIVID в обнаружении фальшивого видео.
DIVID обнаруживает новое поколение видеороликов, созданных генеративным искусственным интеллектом. Он улучшает существующие методы, которые эффективно выявляют видео, созданные старыми моделями ИИ, такими как генеративные антагонистические сети (GAN).
GAN — это система искусственного интеллекта с двумя нейронными сетями: одна создает фальшивые данные, а другая оценивает их, чтобы отличать поддельное от реального. Путем непрерывной обратной связи обе сети улучшаются, что приводит к высококачественному синтетическому видео, практически неотличимому от подлинного.
Текущие инструменты обнаружения искусственного интеллекта ищут характерные признаки — необычное расположение пикселей, ненатуральные движения или несоответствия между кадрами, которые обычно не возникают в реальных видео. Однако новое поколение инструментов с использованием диффузионной модели бросило вызов в области обнаружения фейков.
Преобразование текстов, сгенерированных AI Raidar, в видео
Raidar использует языковую модель для переформулирования или изменения текста, а затем измеряет количество правок, внесенных системой в исходный текст. Большое количество правок означает, что текст, скорее всего, написан человеком, в то время как меньшее число модификаций указывает на то, что текст, скорее всего, создан машиной.
Основное открытие заключается в том, что данные, полученные от ИИ, другие языковые модели оценивают как качественые, поэтому ИИ вносит меньше правок. Учитывая, что генерируемое видео становится все более реалистичным, мы решили взять идею из Raidar и создать инструмент, который точно определит видео, созданное ИИ
— Янг.
Научная статья, включающая в себя открытый код и наборы данных, была представлена на конференции по компьютерному зрению и распознаванию образов (CVPR) в Сиэтле 18 июня 2024 года.
В настоящее время исследователи работают над улучшением платформы DIVID, чтобы она могла обрабатывать различные виды синтетических видео из инструментов создания видео с открытым исходным кодом. Они также используют DIVID для сбора видео для набора данных DIVID.
- Алексей Павлов
- Software Systems Laboratory/Columbia Engineering
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Как на ладони: Обнаружен морской гигант, который виден из космоса
Мегакоралл у Соломоновых островов оказался самым крупным животным Земли....
Забудьте всё, что вы знали о Луне
Новая теория предлагает в корне иное происхождение ночного светила....
Спасти планету сможет… африканский червь
В Кении найдено насекомое с удивительными способностями....
Ляп на ляпе — так профессиональные историки оценили «Гладиатора 2»
Режиссер пришел в бешенство, когда фильм назвали исторически неточным....
Главная тайна Седьмой планеты разгадана через 38 лет
Уран оказался не таким уж странным, как думали ученые....
80 000 лет жизни: какие тайны скрывает самое древнее и большое существо на планете?
Залог невероятного долголетия и удивительного выживания обнаружили учёные....
Раскрыт секрет идеального женского тела?
Оказывается, дело вовсе не в соотношении талии и бедер....
Янтарь из недр Антарктиды раскрыл тайны тропических лесов
Застывшая смола возрастом 90 млн лет как часть исчезнувшей экосистемы....
Саблезубый котёнок томился во льдах Якутии 35 тысяч лет
Благодаря находке стало известно, что сородичи пушистика обитали в столь холодных местах....
Ученые рассказали о жутких последствиях сна
Что происходит, когда снится собственная смерть?...
Носи умные очки или увольняйся!
Amazon планирует заставить всех курьеров носить этот электронный прибор....
Невероятно! Ученая вылечила свой рак вирусами собственного производства
Если человек хочет жить — медицина бессильна....
Разгадано учеными: почему города разрушают сердце и разум
Причины, которые нашли исследователи, вас удивят....
Турбулентность отменяется! А пилоты-люди вообще будут не нужны
Искусственный интеллект может в корне изменить авиацию....
Надеялись на Беса: древние египтянки при беременности хлебали галлюциногенные смеси
Думали, что божок с двусмысленным для нас именем убережёт....
Филигранная работа: Механический скарабей поражает точностью
Робот способен полноценно манипулировать крупногабаритом даже в тесноте....