
Зачем с помощью ИИ создают точные копии клинописи
Расшифровка письменности некоторых народов может оказаться серьёзной проблемой — особенно если это клинопись на глиняных табличках, которым 3000 лет.
Исследователи истории Ближнего Востока начали использовать искусственный интеллект для распознавания и копирования клинописных символов. Причём для этого нет необходимости в оригиналах: достаточно фотографий табличек, чтобы с лёгкостью разбирать сложные тексты.
Наряду с египетскими иероглифами, клинопись — одна из древнейших известных форм грамотности. Состоит она из более чем 1000 уникальных символов, начертание которых может меняться в зависимости от эпохи, культуры, географии и даже от конкретного автора. Естественно, всё это затрудняло интерпретацию выдавленных в глине значков.
Исследователи из Корнеллского и Тель-Авивского университетов разработали компьютерный метод под названием ProtoSnap. Созданное программное обеспечение «прикрепляет» прототип (идеальное начертание, образец) символа к индивидуальным вариациям, которые придали символам писцы.
Благодаря новому подходу исследователи теперь могут сделать точную копию любого клинописного знака и воспроизвести целые участки текста.
О проблематике научного проекта рассказал доцент компьютерных наук Хадар Авербух-Элор. Участник исследования отметил огромную вариативность символов. Даже у одного и того же клинописного значка внешний вид менялся со временем, поэтому очень сложно автоматически расшифровать такие письмена. Доказательством тому и подтверждением актуальности научной работы может служить такой факт: в музеях мира хранится около 500 000 клинописных табличек, но лишь малая их часть была переведена и опубликована.
— Авербух-Элор.
Чтобы проверить, можно ли автоматически расшифровать накопленные снимки, межвузовская команда исследователей применила диффузионную модель. Так называют разновидность генеративной модели ИИ, которую часто используют для компьютерного зрения и генерации изображений. Такое ПО помогает вычислить сходство между каждым пикселем (минимальной единицей визуальной информации) на изображении символа и базовым образцом «буквы». Затем учёные выравнивали две версии символа и подгоняли шаблон под контуры реального конкретного знака.
Снимки клинописных текстов также можно использовать для обучения последующих моделей ИИ, которые выполняют оптическое распознавание символов. Так ПО, по сути, превращает изображения табличек в машиночитаемый текст. Исследователи доказали, что при обучении на этих данных — по сравнению с предыдущими попытками использования ИИ — очередные версии ПО гораздо лучше распознавали клинописные символы, даже те, которые встречаются редко или сильно отличаются друг от друга.
Теперь ProtoSnap способен автоматизировать процесс копирования древних шумерских надписей, экономя экспертам бесчисленное количество часов. А также разработка позволит проводить масштабные сравнения символов из различных эпох, городов, созданных рукой разных писцов.
Профессор Йорам Коэн, ещё один соавтор проекта, сказал, что в основе исследования было стремление увеличить количество доступных науке древних письменных источников в десять раз. Это впервые позволило бы работать с большими объёмами данных, что должно привести к новым измеримым результатам в изучении древних обществ — их религии, экономики, социальной и правовой жизни.
Исследователи истории Ближнего Востока начали использовать искусственный интеллект для распознавания и копирования клинописных символов. Причём для этого нет необходимости в оригиналах: достаточно фотографий табличек, чтобы с лёгкостью разбирать сложные тексты.
Наряду с египетскими иероглифами, клинопись — одна из древнейших известных форм грамотности. Состоит она из более чем 1000 уникальных символов, начертание которых может меняться в зависимости от эпохи, культуры, географии и даже от конкретного автора. Естественно, всё это затрудняло интерпретацию выдавленных в глине значков.
Исследователи из Корнеллского и Тель-Авивского университетов разработали компьютерный метод под названием ProtoSnap. Созданное программное обеспечение «прикрепляет» прототип (идеальное начертание, образец) символа к индивидуальным вариациям, которые придали символам писцы.
Благодаря новому подходу исследователи теперь могут сделать точную копию любого клинописного знака и воспроизвести целые участки текста.
О проблематике научного проекта рассказал доцент компьютерных наук Хадар Авербух-Элор. Участник исследования отметил огромную вариативность символов. Даже у одного и того же клинописного значка внешний вид менялся со временем, поэтому очень сложно автоматически расшифровать такие письмена. Доказательством тому и подтверждением актуальности научной работы может служить такой факт: в музеях мира хранится около 500 000 клинописных табличек, но лишь малая их часть была переведена и опубликована.
Существует бесконечное количество двухмерных сканов этих клинописных табличек, но распознанной информации при этом очень мало
— Авербух-Элор.
Чтобы проверить, можно ли автоматически расшифровать накопленные снимки, межвузовская команда исследователей применила диффузионную модель. Так называют разновидность генеративной модели ИИ, которую часто используют для компьютерного зрения и генерации изображений. Такое ПО помогает вычислить сходство между каждым пикселем (минимальной единицей визуальной информации) на изображении символа и базовым образцом «буквы». Затем учёные выравнивали две версии символа и подгоняли шаблон под контуры реального конкретного знака.
Снимки клинописных текстов также можно использовать для обучения последующих моделей ИИ, которые выполняют оптическое распознавание символов. Так ПО, по сути, превращает изображения табличек в машиночитаемый текст. Исследователи доказали, что при обучении на этих данных — по сравнению с предыдущими попытками использования ИИ — очередные версии ПО гораздо лучше распознавали клинописные символы, даже те, которые встречаются редко или сильно отличаются друг от друга.
Теперь ProtoSnap способен автоматизировать процесс копирования древних шумерских надписей, экономя экспертам бесчисленное количество часов. А также разработка позволит проводить масштабные сравнения символов из различных эпох, городов, созданных рукой разных писцов.
Профессор Йорам Коэн, ещё один соавтор проекта, сказал, что в основе исследования было стремление увеличить количество доступных науке древних письменных источников в десять раз. Это впервые позволило бы работать с большими объёмами данных, что должно привести к новым измеримым результатам в изучении древних обществ — их религии, экономики, социальной и правовой жизни.
- Дмитрий Ладыгин
- tau-vailab.github.io
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас

Истинная сверхсамка: крупнейший в мире клон нашли в Балтийском море
Простирается на 500 км....

«Невидимый» город переписывает всю историю Римской империи
Порт, крытый театр на 1500 человек, множество зданий — про это вам точно не рассказывали в школе....

Метро для крокодилов: обнаружена подземная сеть, которой пользуются 35 видов животных
Флоридские ученые говорят, что они не ожидали увидеть такое....

Подлинное лицо Моцарта восстановлено. И это не человек с картин
Почему новая реконструкция вызвала ожесточенные споры у историков и музыковедов?...

Создан из света: лазерный луч впервые превратили в сверхтвёрдое вещество
Увидеть не получится, можно лишь представить....

Провал миссии Trailblazer ощутимо замедлит американскую колонизацию Луны
Пять миссий — пять провалов: почему дешевые космические проекты стали головной болью NASA?...

Шаттер-конусы и секрет Пилбары: кто ударил по Земле 3,5 миллиарда лет назад?
Австралийские ученые считают, что удары астероидов запустили образование материков и континентов на планете....

4000 лет под землей, связь с Британией и тайный культ солнца
Как находка в Аарсе переписывает историю древней Европы....

Космический корабль SpaceX снова взорвался. И это вторая катастрофа меньше чем за три месяца
Случайное совпадение или Маску мстят за участие в большой политике?...

В Великобритании зафиксирована эпидемия аномальной глухоты
Врачи говорят, что болезнь провоцируют… современные продвинутые наушники....

Им 1,5 миллиона лет: костяные орудия подняли новые вопросы о предках человека
Речь идёт о систематическом изготовлении....

Даже одна ночь без сна «взрывает» иммунную систему
Кувейтские ученые рассказали: почему недосып опаснее фастфуда, а ваши клетки объявляют вам же войну....

Доказательства — в гнёздах: пластик привёл к новой геологической эпохе
Птичьи постройки превратились в капсулы времени....

Библейское чудо с переходом сквозь море оказалось на 100% вероятным
Океанограф Карл Дрюс доказал, что чудо и формулы уживаются в одной истории....

PetPhone полностью переписывает правила общения с нашими питомцами
ИИ-звонки, детектор стресса, 7 дней автономки — такому позавидуют даже «взрослые» смартфоны....

Зачем с помощью ИИ создают точные копии клинописи
Фото глиняных табличек превратили в машиночитаемый текст....