Зачем с помощью ИИ создают точные копии клинописи
Расшифровка письменности некоторых народов может оказаться серьёзной проблемой — особенно если это клинопись на глиняных табличках, которым 3000 лет.
Исследователи истории Ближнего Востока начали использовать искусственный интеллект для распознавания и копирования клинописных символов. Причём для этого нет необходимости в оригиналах: достаточно фотографий табличек, чтобы с лёгкостью разбирать сложные тексты.
Наряду с египетскими иероглифами, клинопись — одна из древнейших известных форм грамотности. Состоит она из более чем 1000 уникальных символов, начертание которых может меняться в зависимости от эпохи, культуры, географии и даже от конкретного автора. Естественно, всё это затрудняло интерпретацию выдавленных в глине значков.
Исследователи из Корнеллского и Тель-Авивского университетов разработали компьютерный метод под названием ProtoSnap. Созданное программное обеспечение «прикрепляет» прототип (идеальное начертание, образец) символа к индивидуальным вариациям, которые придали символам писцы.
Благодаря новому подходу исследователи теперь могут сделать точную копию любого клинописного знака и воспроизвести целые участки текста.
О проблематике научного проекта рассказал доцент компьютерных наук Хадар Авербух-Элор. Участник исследования отметил огромную вариативность символов. Даже у одного и того же клинописного значка внешний вид менялся со временем, поэтому очень сложно автоматически расшифровать такие письмена. Доказательством тому и подтверждением актуальности научной работы может служить такой факт: в музеях мира хранится около 500 000 клинописных табличек, но лишь малая их часть была переведена и опубликована.
— Авербух-Элор.
Чтобы проверить, можно ли автоматически расшифровать накопленные снимки, межвузовская команда исследователей применила диффузионную модель. Так называют разновидность генеративной модели ИИ, которую часто используют для компьютерного зрения и генерации изображений. Такое ПО помогает вычислить сходство между каждым пикселем (минимальной единицей визуальной информации) на изображении символа и базовым образцом «буквы». Затем учёные выравнивали две версии символа и подгоняли шаблон под контуры реального конкретного знака.
Снимки клинописных текстов также можно использовать для обучения последующих моделей ИИ, которые выполняют оптическое распознавание символов. Так ПО, по сути, превращает изображения табличек в машиночитаемый текст. Исследователи доказали, что при обучении на этих данных — по сравнению с предыдущими попытками использования ИИ — очередные версии ПО гораздо лучше распознавали клинописные символы, даже те, которые встречаются редко или сильно отличаются друг от друга.
Теперь ProtoSnap способен автоматизировать процесс копирования древних шумерских надписей, экономя экспертам бесчисленное количество часов. А также разработка позволит проводить масштабные сравнения символов из различных эпох, городов, созданных рукой разных писцов.
Профессор Йорам Коэн, ещё один соавтор проекта, сказал, что в основе исследования было стремление увеличить количество доступных науке древних письменных источников в десять раз. Это впервые позволило бы работать с большими объёмами данных, что должно привести к новым измеримым результатам в изучении древних обществ — их религии, экономики, социальной и правовой жизни.
Исследователи истории Ближнего Востока начали использовать искусственный интеллект для распознавания и копирования клинописных символов. Причём для этого нет необходимости в оригиналах: достаточно фотографий табличек, чтобы с лёгкостью разбирать сложные тексты.
Наряду с египетскими иероглифами, клинопись — одна из древнейших известных форм грамотности. Состоит она из более чем 1000 уникальных символов, начертание которых может меняться в зависимости от эпохи, культуры, географии и даже от конкретного автора. Естественно, всё это затрудняло интерпретацию выдавленных в глине значков.
Исследователи из Корнеллского и Тель-Авивского университетов разработали компьютерный метод под названием ProtoSnap. Созданное программное обеспечение «прикрепляет» прототип (идеальное начертание, образец) символа к индивидуальным вариациям, которые придали символам писцы.
Благодаря новому подходу исследователи теперь могут сделать точную копию любого клинописного знака и воспроизвести целые участки текста.
О проблематике научного проекта рассказал доцент компьютерных наук Хадар Авербух-Элор. Участник исследования отметил огромную вариативность символов. Даже у одного и того же клинописного значка внешний вид менялся со временем, поэтому очень сложно автоматически расшифровать такие письмена. Доказательством тому и подтверждением актуальности научной работы может служить такой факт: в музеях мира хранится около 500 000 клинописных табличек, но лишь малая их часть была переведена и опубликована.
Существует бесконечное количество двухмерных сканов этих клинописных табличек, но распознанной информации при этом очень мало
— Авербух-Элор.
Чтобы проверить, можно ли автоматически расшифровать накопленные снимки, межвузовская команда исследователей применила диффузионную модель. Так называют разновидность генеративной модели ИИ, которую часто используют для компьютерного зрения и генерации изображений. Такое ПО помогает вычислить сходство между каждым пикселем (минимальной единицей визуальной информации) на изображении символа и базовым образцом «буквы». Затем учёные выравнивали две версии символа и подгоняли шаблон под контуры реального конкретного знака.
Снимки клинописных текстов также можно использовать для обучения последующих моделей ИИ, которые выполняют оптическое распознавание символов. Так ПО, по сути, превращает изображения табличек в машиночитаемый текст. Исследователи доказали, что при обучении на этих данных — по сравнению с предыдущими попытками использования ИИ — очередные версии ПО гораздо лучше распознавали клинописные символы, даже те, которые встречаются редко или сильно отличаются друг от друга.
Теперь ProtoSnap способен автоматизировать процесс копирования древних шумерских надписей, экономя экспертам бесчисленное количество часов. А также разработка позволит проводить масштабные сравнения символов из различных эпох, городов, созданных рукой разных писцов.
Профессор Йорам Коэн, ещё один соавтор проекта, сказал, что в основе исследования было стремление увеличить количество доступных науке древних письменных источников в десять раз. Это впервые позволило бы работать с большими объёмами данных, что должно привести к новым измеримым результатам в изучении древних обществ — их религии, экономики, социальной и правовой жизни.
- Дмитрий Ладыгин
- tau-vailab.github.io
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Битва под Каневом: почему на 350 лет замолчали сокрушительную победу России?
Неудобная победа, предательство и идеология. Мы бы могли вообще не узнать об этом триумфе русского оружия...
Бомбы с орбиты: почему советская технология, воскрешенная Китаем, встревожила США?
Американцы слишком долго считали свои системы раннего предупреждения лучшими на планете. Теперь......
С Ноева ковчега сняли запрет: что покажут радары на Арарате?
История, которую больше всего высмеивали ученые, неожиданно становится все более реальной...
Дикий народ чучуна: Кто наводил ужас на коренное население Сибири?
Йети? Люди-изгои? Древнее племя? Пока что вопросов больше, чем ответов...
Почему их ДНК не меняется уже 42 000 лет: определен самый древний народ на планете
Три раза предки жителей Океании встречались с исчезнувшими видами людей, и это в корне изменило их гены...
Тайна «косого глаза» Венеры раскрыта: что увидела нейросеть на картинах Боттичелли?
Художник нарисовал пять портретов прекрасной Симонетты Веспуччи. И каждое полотно еще больше подтверждает страшный диагноз...
Мрачный прогноз для США из 1995 года сбылся: в чем великий ученый Саган оказался прав?
Исследователь говорил: все плохо, но еще не все потеряно. Его советы могут реально помочь всему человечеству...
Новая вселенная внутри звезды: почему Эйнштейн мог ошибаться насчет черных дыр
Больше 20 лет эта гипотеза в буквальном смысле раздирает мир науки. Но, возможно, именно она выведет ученых из тупика сингулярности...
Прорыв в астрономии: найти жизнь в космосе будет гораздо проще
Ученых не пугает даже погрешность в 20%. Зато будут просканированы тысячи планет...
Марс под вопросом: что может обнулить иммунитет у космонавтов?
И почему защита организма перестает видеть микробы, выжившие в космосе?...
43 — проклятый возраст Рюриковичей: почему многие князья не переживали этот роковой рубеж?
Генетики говорят: русская династия слишком поздно поняла, что попала в ловушку «чистой» крови...
Снегопады в Антарктиде становятся все аномальнее: и ученые, наконец-то, знают почему?
Ученым придется пересмотреть все климатические модели Шестого континента. Кстати, снега там будет выпадать с каждым годом все больше...
Доказана жизнь на спутнике Юпитера: как же бактериям удалось добраться с Земли на Европу?
За 3,5 миллиарда лет земные бактерии могли долететь до 105 звездных систем. Так что у Европы есть все шансы на «заражение»...
Сначала Стоунхендж был... не каменным: найден прототип легендарного святилища
Доисторическая религия оказалась старше на 500 лет, чем считали ученые. И она играла огромную роль в жизни древних людей...
Бельгийскую разведку снова взломали: хакеры целый год качали оттуда секретные данные
Эксперты говорят: проникновение было замечено совершенно случайно. И это пугает...