Зачем с помощью ИИ создают точные копии клинописи
365

Зачем с помощью ИИ создают точные копии клинописи

Расшифровка письменности некоторых народов может оказаться серьёзной проблемой — особенно если это клинопись на глиняных табличках, которым 3000 лет.


Исследователи истории Ближнего Востока начали использовать искусственный интеллект для распознавания и копирования клинописных символов. Причём для этого нет необходимости в оригиналах: достаточно фотографий табличек, чтобы с лёгкостью разбирать сложные тексты.

Наряду с египетскими иероглифами, клинопись — одна из древнейших известных форм грамотности. Состоит она из более чем 1000 уникальных символов, начертание которых может меняться в зависимости от эпохи, культуры, географии и даже от конкретного автора. Естественно, всё это затрудняло интерпретацию выдавленных в глине значков.

Исследователи из Корнеллского и Тель-Авивского университетов разработали компьютерный метод под названием ProtoSnap. Созданное программное обеспечение «прикрепляет» прототип (идеальное начертание, образец) символа к индивидуальным вариациям, которые придали символам писцы.

Благодаря новому подходу исследователи теперь могут сделать точную копию любого клинописного знака и воспроизвести целые участки текста.

О проблематике научного проекта рассказал доцент компьютерных наук Хадар Авербух-Элор. Участник исследования отметил огромную вариативность символов. Даже у одного и того же клинописного значка внешний вид менялся со временем, поэтому очень сложно автоматически расшифровать такие письмена. Доказательством тому и подтверждением актуальности научной работы может служить такой факт: в музеях мира хранится около 500 000 клинописных табличек, но лишь малая их часть была переведена и опубликована.

Существует бесконечное количество двухмерных сканов этих клинописных табличек, но распознанной информации при этом очень мало

— Авербух-Элор.

Чтобы проверить, можно ли автоматически расшифровать накопленные снимки, межвузовская команда исследователей применила диффузионную модель. Так называют разновидность генеративной модели ИИ, которую часто используют для компьютерного зрения и генерации изображений. Такое ПО помогает вычислить сходство между каждым пикселем (минимальной единицей визуальной информации) на изображении символа и базовым образцом «буквы». Затем учёные выравнивали две версии символа и подгоняли шаблон под контуры реального конкретного знака.

Снимки клинописных текстов также можно использовать для обучения последующих моделей ИИ, которые выполняют оптическое распознавание символов. Так ПО, по сути, превращает изображения табличек в машиночитаемый текст. Исследователи доказали, что при обучении на этих данных — по сравнению с предыдущими попытками использования ИИ — очередные версии ПО гораздо лучше распознавали клинописные символы, даже те, которые встречаются редко или сильно отличаются друг от друга.

Теперь ProtoSnap способен автоматизировать процесс копирования древних шумерских надписей, экономя экспертам бесчисленное количество часов. А также разработка позволит проводить масштабные сравнения символов из различных эпох, городов, созданных рукой разных писцов.

Профессор Йорам Коэн, ещё один соавтор проекта, сказал, что в основе исследования было стремление увеличить количество доступных науке древних письменных источников в десять раз. Это впервые позволило бы работать с большими объёмами данных, что должно привести к новым измеримым результатам в изучении древних обществ — их религии, экономики, социальной и правовой жизни.
Наши новостные каналы

Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.

Рекомендуем для вас