
Новый инструмент обнаруживает видео, созданные искусственным интеллектом, с точностью 93,7%
В этом году сотрудник многонациональной корпорации перевел мошенникам 25 млн долларов. Инструкции по переводу денег, как он думал, ему прислал финансовый директор компании. На самом деле преступники использовали программу искусственного интеллекта для создания реалистичных видеороликов с участием финдиректора и нескольких коллег бедолаги.
Видеоролики, созданные искусственным интеллектом, стали настолько реалистичными, что люди (и существующие системы обнаружения) испытывают трудности с различением настоящего и поддельного видео. Чтобы решить эту проблему, исследователи из Колумбийского инженерного факультета под руководством профессора компьютерных наук Чжунфэн Янга разработали новый инструмент для обнаружения видеороликов, созданных искусственным интеллектом.
Инструмент назвали DIVID (DIffusion-generated VIdeo Detector). Он расширяет проект команды, выпустившей ранее инструмент Raidar. Программа обнаруживает тексты, созданные искусственным интеллектом, анализируя их содержимое, без необходимости доступа к внутренним механизмам больших языковых моделей.
В первом столбце на фото: видеокадры с YouTube и фейковые видеоролики, созданные OpenAI из Sora. Во втором — кадры, восстановленные методом диффузии, а в конце отражены различия между первым и вторым столбцами.
DIRE (Ошибка реконструкции DIffusion) — это метод, который измеряет разницу между входным и соответствующим выходным изображением, восстановленным с помощью предварительно обученной диффузионной модели.
Как демонстрирует иллюстрация, реальные видеокадры имеют больше отличий от восстановленных кадров, чем от видео, созданного диффузией Это и является ключевым моментом для DIVID в обнаружении фальшивого видео.
DIVID обнаруживает новое поколение видеороликов, созданных генеративным искусственным интеллектом. Он улучшает существующие методы, которые эффективно выявляют видео, созданные старыми моделями ИИ, такими как генеративные антагонистические сети (GAN).
GAN — это система искусственного интеллекта с двумя нейронными сетями: одна создает фальшивые данные, а другая оценивает их, чтобы отличать поддельное от реального. Путем непрерывной обратной связи обе сети улучшаются, что приводит к высококачественному синтетическому видео, практически неотличимому от подлинного.
Текущие инструменты обнаружения искусственного интеллекта ищут характерные признаки — необычное расположение пикселей, ненатуральные движения или несоответствия между кадрами, которые обычно не возникают в реальных видео. Однако новое поколение инструментов с использованием диффузионной модели бросило вызов в области обнаружения фейков.
Raidar использует языковую модель для переформулирования или изменения текста, а затем измеряет количество правок, внесенных системой в исходный текст. Большое количество правок означает, что текст, скорее всего, написан человеком, в то время как меньшее число модификаций указывает на то, что текст, скорее всего, создан машиной.
— Янг.
Научная статья, включающая в себя открытый код и наборы данных, была представлена на конференции по компьютерному зрению и распознаванию образов (CVPR) в Сиэтле 18 июня 2024 года.
В настоящее время исследователи работают над улучшением платформы DIVID, чтобы она могла обрабатывать различные виды синтетических видео из инструментов создания видео с открытым исходным кодом. Они также используют DIVID для сбора видео для набора данных DIVID.
Видеоролики, созданные искусственным интеллектом, стали настолько реалистичными, что люди (и существующие системы обнаружения) испытывают трудности с различением настоящего и поддельного видео. Чтобы решить эту проблему, исследователи из Колумбийского инженерного факультета под руководством профессора компьютерных наук Чжунфэн Янга разработали новый инструмент для обнаружения видеороликов, созданных искусственным интеллектом.
Инструмент назвали DIVID (DIffusion-generated VIdeo Detector). Он расширяет проект команды, выпустившей ранее инструмент Raidar. Программа обнаруживает тексты, созданные искусственным интеллектом, анализируя их содержимое, без необходимости доступа к внутренним механизмам больших языковых моделей.
В первом столбце на фото: видеокадры с YouTube и фейковые видеоролики, созданные OpenAI из Sora. Во втором — кадры, восстановленные методом диффузии, а в конце отражены различия между первым и вторым столбцами.
DIRE (Ошибка реконструкции DIffusion) — это метод, который измеряет разницу между входным и соответствующим выходным изображением, восстановленным с помощью предварительно обученной диффузионной модели.
Как демонстрирует иллюстрация, реальные видеокадры имеют больше отличий от восстановленных кадров, чем от видео, созданного диффузией Это и является ключевым моментом для DIVID в обнаружении фальшивого видео.
DIVID обнаруживает новое поколение видеороликов, созданных генеративным искусственным интеллектом. Он улучшает существующие методы, которые эффективно выявляют видео, созданные старыми моделями ИИ, такими как генеративные антагонистические сети (GAN).
GAN — это система искусственного интеллекта с двумя нейронными сетями: одна создает фальшивые данные, а другая оценивает их, чтобы отличать поддельное от реального. Путем непрерывной обратной связи обе сети улучшаются, что приводит к высококачественному синтетическому видео, практически неотличимому от подлинного.
Текущие инструменты обнаружения искусственного интеллекта ищут характерные признаки — необычное расположение пикселей, ненатуральные движения или несоответствия между кадрами, которые обычно не возникают в реальных видео. Однако новое поколение инструментов с использованием диффузионной модели бросило вызов в области обнаружения фейков.
Преобразование текстов, сгенерированных AI Raidar, в видео
Raidar использует языковую модель для переформулирования или изменения текста, а затем измеряет количество правок, внесенных системой в исходный текст. Большое количество правок означает, что текст, скорее всего, написан человеком, в то время как меньшее число модификаций указывает на то, что текст, скорее всего, создан машиной.
Основное открытие заключается в том, что данные, полученные от ИИ, другие языковые модели оценивают как качественые, поэтому ИИ вносит меньше правок. Учитывая, что генерируемое видео становится все более реалистичным, мы решили взять идею из Raidar и создать инструмент, который точно определит видео, созданное ИИ
— Янг.
Научная статья, включающая в себя открытый код и наборы данных, была представлена на конференции по компьютерному зрению и распознаванию образов (CVPR) в Сиэтле 18 июня 2024 года.
В настоящее время исследователи работают над улучшением платформы DIVID, чтобы она могла обрабатывать различные виды синтетических видео из инструментов создания видео с открытым исходным кодом. Они также используют DIVID для сбора видео для набора данных DIVID.
- Алексей Павлов
- Software Systems Laboratory/Columbia Engineering
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас

Скрытые миллиарды: население Земли оказалось гораздо больше, чем считалось
Новые исследования бросают вызов официальным демографическим данным....

«Инопланетяне» на Земле? Древние 8-метровые «грибы» оказались совершенно неизвестной формой жизни
Вот уже 180 лет подряд живые «башни» ставят в тупик всю науку....

Тайна болезней на космической станции наконец-то раскрыта!
Ученые говорят: во всем виновата… идеальная уборка на МКС....

«Шерстистый дьявол» обнаружен в пустыне, на границе Мексики и США
Ученые говорят: такой уникальной находки не было последние полвека....

Американские спецслужбы скрывают правду о самой древней из библейских реликвий?
Экстрасенс ЦРУ предупредил: Ковчег Завета убьет каждого, кто к нему прикоснется....

Ученые рассказали и показали, как выглядит Антарктида без льда
Высокие горы, глубочайшие каньоны, 58 метров до Апокалипсиса и множество других тайн....

Археологи ликуют: в Испании нашли рисунки, которые старше человечества!
200 000-летняя находка заставит пересмотреть учебники....

iPhone, давай до свидания! Илон Маск презентовал инновационный смартфон PhoneX
Это устройство слишком прекрасно для нашей реальности....

Самые массовые и дикие розыгрыши на 1 апреля в мировой истории
Это вам не просто «вся спина белая»....

Кислород устарел! Ученые нашли новый ключ к внеземной жизни
Гицеанические миры могут стать новой надеждой астрофизиков....

Ученые поражены: мыши, как спасатели, оживляют своих сородичей, попавших в беду
Открытие, от которого дрогнет даже самое черствое сердце....

На 100 000 лет раньше людей: ученые рассказали, кто устроил первые похороны на планете
Загадочные карлики Homo naledi, чей мозг был размером с апельсин, оказались не глупее нас с вами....

Секретная мутация гена: оказалось, ее имеют все обитатели Марианской впадины
Поразительное открытие китайских ученых может изменить всю теорию эволюции....

Ученый рассказал, как использовались загадочные артефакты из гробницы Тутанхамона
Это было как в фильме «Мумия»: «Фараон должен воскреснуть!»...

Гигантский айсберг скрывал древнюю живую экосистему
Губки и кораллы благоденствуют на обнажившемся морском дне в месте, ранее недоступном взгляду....

Зад-ловушка: причудливое существо из янтаря было за гранью воображения
Задняя часть тела работала… как растение....