Зачем с помощью ИИ создают точные копии клинописи
Расшифровка письменности некоторых народов может оказаться серьёзной проблемой — особенно если это клинопись на глиняных табличках, которым 3000 лет.
Исследователи истории Ближнего Востока начали использовать искусственный интеллект для распознавания и копирования клинописных символов. Причём для этого нет необходимости в оригиналах: достаточно фотографий табличек, чтобы с лёгкостью разбирать сложные тексты.
Наряду с египетскими иероглифами, клинопись — одна из древнейших известных форм грамотности. Состоит она из более чем 1000 уникальных символов, начертание которых может меняться в зависимости от эпохи, культуры, географии и даже от конкретного автора. Естественно, всё это затрудняло интерпретацию выдавленных в глине значков.
Исследователи из Корнеллского и Тель-Авивского университетов разработали компьютерный метод под названием ProtoSnap. Созданное программное обеспечение «прикрепляет» прототип (идеальное начертание, образец) символа к индивидуальным вариациям, которые придали символам писцы.
Благодаря новому подходу исследователи теперь могут сделать точную копию любого клинописного знака и воспроизвести целые участки текста.
О проблематике научного проекта рассказал доцент компьютерных наук Хадар Авербух-Элор. Участник исследования отметил огромную вариативность символов. Даже у одного и того же клинописного значка внешний вид менялся со временем, поэтому очень сложно автоматически расшифровать такие письмена. Доказательством тому и подтверждением актуальности научной работы может служить такой факт: в музеях мира хранится около 500 000 клинописных табличек, но лишь малая их часть была переведена и опубликована.
— Авербух-Элор.
Чтобы проверить, можно ли автоматически расшифровать накопленные снимки, межвузовская команда исследователей применила диффузионную модель. Так называют разновидность генеративной модели ИИ, которую часто используют для компьютерного зрения и генерации изображений. Такое ПО помогает вычислить сходство между каждым пикселем (минимальной единицей визуальной информации) на изображении символа и базовым образцом «буквы». Затем учёные выравнивали две версии символа и подгоняли шаблон под контуры реального конкретного знака.
Снимки клинописных текстов также можно использовать для обучения последующих моделей ИИ, которые выполняют оптическое распознавание символов. Так ПО, по сути, превращает изображения табличек в машиночитаемый текст. Исследователи доказали, что при обучении на этих данных — по сравнению с предыдущими попытками использования ИИ — очередные версии ПО гораздо лучше распознавали клинописные символы, даже те, которые встречаются редко или сильно отличаются друг от друга.
Теперь ProtoSnap способен автоматизировать процесс копирования древних шумерских надписей, экономя экспертам бесчисленное количество часов. А также разработка позволит проводить масштабные сравнения символов из различных эпох, городов, созданных рукой разных писцов.
Профессор Йорам Коэн, ещё один соавтор проекта, сказал, что в основе исследования было стремление увеличить количество доступных науке древних письменных источников в десять раз. Это впервые позволило бы работать с большими объёмами данных, что должно привести к новым измеримым результатам в изучении древних обществ — их религии, экономики, социальной и правовой жизни.
Исследователи истории Ближнего Востока начали использовать искусственный интеллект для распознавания и копирования клинописных символов. Причём для этого нет необходимости в оригиналах: достаточно фотографий табличек, чтобы с лёгкостью разбирать сложные тексты.
Наряду с египетскими иероглифами, клинопись — одна из древнейших известных форм грамотности. Состоит она из более чем 1000 уникальных символов, начертание которых может меняться в зависимости от эпохи, культуры, географии и даже от конкретного автора. Естественно, всё это затрудняло интерпретацию выдавленных в глине значков.
Исследователи из Корнеллского и Тель-Авивского университетов разработали компьютерный метод под названием ProtoSnap. Созданное программное обеспечение «прикрепляет» прототип (идеальное начертание, образец) символа к индивидуальным вариациям, которые придали символам писцы.
Благодаря новому подходу исследователи теперь могут сделать точную копию любого клинописного знака и воспроизвести целые участки текста.
О проблематике научного проекта рассказал доцент компьютерных наук Хадар Авербух-Элор. Участник исследования отметил огромную вариативность символов. Даже у одного и того же клинописного значка внешний вид менялся со временем, поэтому очень сложно автоматически расшифровать такие письмена. Доказательством тому и подтверждением актуальности научной работы может служить такой факт: в музеях мира хранится около 500 000 клинописных табличек, но лишь малая их часть была переведена и опубликована.
Существует бесконечное количество двухмерных сканов этих клинописных табличек, но распознанной информации при этом очень мало
— Авербух-Элор.
Чтобы проверить, можно ли автоматически расшифровать накопленные снимки, межвузовская команда исследователей применила диффузионную модель. Так называют разновидность генеративной модели ИИ, которую часто используют для компьютерного зрения и генерации изображений. Такое ПО помогает вычислить сходство между каждым пикселем (минимальной единицей визуальной информации) на изображении символа и базовым образцом «буквы». Затем учёные выравнивали две версии символа и подгоняли шаблон под контуры реального конкретного знака.
Снимки клинописных текстов также можно использовать для обучения последующих моделей ИИ, которые выполняют оптическое распознавание символов. Так ПО, по сути, превращает изображения табличек в машиночитаемый текст. Исследователи доказали, что при обучении на этих данных — по сравнению с предыдущими попытками использования ИИ — очередные версии ПО гораздо лучше распознавали клинописные символы, даже те, которые встречаются редко или сильно отличаются друг от друга.
Теперь ProtoSnap способен автоматизировать процесс копирования древних шумерских надписей, экономя экспертам бесчисленное количество часов. А также разработка позволит проводить масштабные сравнения символов из различных эпох, городов, созданных рукой разных писцов.
Профессор Йорам Коэн, ещё один соавтор проекта, сказал, что в основе исследования было стремление увеличить количество доступных науке древних письменных источников в десять раз. Это впервые позволило бы работать с большими объёмами данных, что должно привести к новым измеримым результатам в изучении древних обществ — их религии, экономики, социальной и правовой жизни.
- Дмитрий Ладыгин
- tau-vailab.github.io
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Припрятал сокровища, но был убит: историки раскрыли трагическую судьбу владельца богатейшего клада Москвы
Почему наследники так и не нашли это огромное состояние, хотя ходили по нему каждый день?...
Пчелы стремительно исчезают в России: из-за чего так происходит и чем это грозит россиянам?
Почему ученые считают, что государство самоустранилось от решения данной проблемы?...
Еще одно пророчество Жириновского сбывается прямо сейчас. Белые люди едут в Россию
По словам экспертов, на этот раз все очень серьезно. Договариваться о переселенцах приехал Эролл Маск, отец знаменитого миллиардера...
100 000-летняя загадка: ученые назвали предмет, благодаря которому люди сумели заселить всю планету
Американские антропологи не ожидали, что такой простой артефакт окажется настолько универсальным и полезным...
Тайну «проклятия фараонов» раскрыло письмо столетней давности
Открыватель гробницы Тутанхамона, археолог Говард Картер, прямо называл имя человека, который изобрел «сенсацию». В итоге потрясающее научное открытие...
Стало известно, почему Эверест аномально ухудшает здоровье у тысяч альпинистов
Никакой мистики, но очень много криминала. Непальская полиция раскрыла колоссальное преступление, жертвами которого стали 4782 иностранца...
«Боевые роботы» СССР на Зимней войне: как уникальные танки без экипажей вызывали ужас у финнов
Эксперты назвали главные причины, почему прорывной проект Остехбюро был закрыт...
Что не так с отстрелом бакланов на Байкале: почему иркутский биолог раскритиковал планы областной администрации?
Профессор Сергей Пыжьянов предупреждает: ответ, который может дать природа, сведет на нет все усилия человека. В итоге будет только хуже...
На Венере, вероятно, есть жизнь: угадайте, как и откуда она туда попала?
Эксперты оценивают шансы как весьма значительные и достаточные, тем более что условия на соседней планете есть...
Кусочек мха помог раскрыть запутанное дело о разграблении могил
Преступники имели очень сильное алиби, но хлорофилловые часы сдали их с поличным...
Гвоздь в грудь: зачем римляне пронзали своих умерших?
Археологи говорят: мрачный ритуал захватил всю Империю от столицы до окраин. При этом сами люди не видели в нем ничего плохого и считали крайне важным...