
Зачем с помощью ИИ создают точные копии клинописи
Расшифровка письменности некоторых народов может оказаться серьёзной проблемой — особенно если это клинопись на глиняных табличках, которым 3000 лет.
Исследователи истории Ближнего Востока начали использовать искусственный интеллект для распознавания и копирования клинописных символов. Причём для этого нет необходимости в оригиналах: достаточно фотографий табличек, чтобы с лёгкостью разбирать сложные тексты.
Наряду с египетскими иероглифами, клинопись — одна из древнейших известных форм грамотности. Состоит она из более чем 1000 уникальных символов, начертание которых может меняться в зависимости от эпохи, культуры, географии и даже от конкретного автора. Естественно, всё это затрудняло интерпретацию выдавленных в глине значков.
Исследователи из Корнеллского и Тель-Авивского университетов разработали компьютерный метод под названием ProtoSnap. Созданное программное обеспечение «прикрепляет» прототип (идеальное начертание, образец) символа к индивидуальным вариациям, которые придали символам писцы.
Благодаря новому подходу исследователи теперь могут сделать точную копию любого клинописного знака и воспроизвести целые участки текста.
О проблематике научного проекта рассказал доцент компьютерных наук Хадар Авербух-Элор. Участник исследования отметил огромную вариативность символов. Даже у одного и того же клинописного значка внешний вид менялся со временем, поэтому очень сложно автоматически расшифровать такие письмена. Доказательством тому и подтверждением актуальности научной работы может служить такой факт: в музеях мира хранится около 500 000 клинописных табличек, но лишь малая их часть была переведена и опубликована.
— Авербух-Элор.
Чтобы проверить, можно ли автоматически расшифровать накопленные снимки, межвузовская команда исследователей применила диффузионную модель. Так называют разновидность генеративной модели ИИ, которую часто используют для компьютерного зрения и генерации изображений. Такое ПО помогает вычислить сходство между каждым пикселем (минимальной единицей визуальной информации) на изображении символа и базовым образцом «буквы». Затем учёные выравнивали две версии символа и подгоняли шаблон под контуры реального конкретного знака.
Снимки клинописных текстов также можно использовать для обучения последующих моделей ИИ, которые выполняют оптическое распознавание символов. Так ПО, по сути, превращает изображения табличек в машиночитаемый текст. Исследователи доказали, что при обучении на этих данных — по сравнению с предыдущими попытками использования ИИ — очередные версии ПО гораздо лучше распознавали клинописные символы, даже те, которые встречаются редко или сильно отличаются друг от друга.
Теперь ProtoSnap способен автоматизировать процесс копирования древних шумерских надписей, экономя экспертам бесчисленное количество часов. А также разработка позволит проводить масштабные сравнения символов из различных эпох, городов, созданных рукой разных писцов.
Профессор Йорам Коэн, ещё один соавтор проекта, сказал, что в основе исследования было стремление увеличить количество доступных науке древних письменных источников в десять раз. Это впервые позволило бы работать с большими объёмами данных, что должно привести к новым измеримым результатам в изучении древних обществ — их религии, экономики, социальной и правовой жизни.
Исследователи истории Ближнего Востока начали использовать искусственный интеллект для распознавания и копирования клинописных символов. Причём для этого нет необходимости в оригиналах: достаточно фотографий табличек, чтобы с лёгкостью разбирать сложные тексты.
Наряду с египетскими иероглифами, клинопись — одна из древнейших известных форм грамотности. Состоит она из более чем 1000 уникальных символов, начертание которых может меняться в зависимости от эпохи, культуры, географии и даже от конкретного автора. Естественно, всё это затрудняло интерпретацию выдавленных в глине значков.
Исследователи из Корнеллского и Тель-Авивского университетов разработали компьютерный метод под названием ProtoSnap. Созданное программное обеспечение «прикрепляет» прототип (идеальное начертание, образец) символа к индивидуальным вариациям, которые придали символам писцы.
Благодаря новому подходу исследователи теперь могут сделать точную копию любого клинописного знака и воспроизвести целые участки текста.
О проблематике научного проекта рассказал доцент компьютерных наук Хадар Авербух-Элор. Участник исследования отметил огромную вариативность символов. Даже у одного и того же клинописного значка внешний вид менялся со временем, поэтому очень сложно автоматически расшифровать такие письмена. Доказательством тому и подтверждением актуальности научной работы может служить такой факт: в музеях мира хранится около 500 000 клинописных табличек, но лишь малая их часть была переведена и опубликована.
Существует бесконечное количество двухмерных сканов этих клинописных табличек, но распознанной информации при этом очень мало
— Авербух-Элор.
Чтобы проверить, можно ли автоматически расшифровать накопленные снимки, межвузовская команда исследователей применила диффузионную модель. Так называют разновидность генеративной модели ИИ, которую часто используют для компьютерного зрения и генерации изображений. Такое ПО помогает вычислить сходство между каждым пикселем (минимальной единицей визуальной информации) на изображении символа и базовым образцом «буквы». Затем учёные выравнивали две версии символа и подгоняли шаблон под контуры реального конкретного знака.
Снимки клинописных текстов также можно использовать для обучения последующих моделей ИИ, которые выполняют оптическое распознавание символов. Так ПО, по сути, превращает изображения табличек в машиночитаемый текст. Исследователи доказали, что при обучении на этих данных — по сравнению с предыдущими попытками использования ИИ — очередные версии ПО гораздо лучше распознавали клинописные символы, даже те, которые встречаются редко или сильно отличаются друг от друга.
Теперь ProtoSnap способен автоматизировать процесс копирования древних шумерских надписей, экономя экспертам бесчисленное количество часов. А также разработка позволит проводить масштабные сравнения символов из различных эпох, городов, созданных рукой разных писцов.
Профессор Йорам Коэн, ещё один соавтор проекта, сказал, что в основе исследования было стремление увеличить количество доступных науке древних письменных источников в десять раз. Это впервые позволило бы работать с большими объёмами данных, что должно привести к новым измеримым результатам в изучении древних обществ — их религии, экономики, социальной и правовой жизни.
- Дмитрий Ладыгин
- tau-vailab.github.io
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас

Это была самая позорная и страшная из всех видов казней
Воинов империи Хань обнаружили расчлененными в братской могиле 2000-летней давности на территории Монголии....

Тройной ядовитый укус: мутация смертельной змеи из Австралии может переписать правила эволюции?
Она впрыскивает двойную дозу яда за 0,15 секунды. Поэтому ее боятся даже герпетологи....

Голландский подросток внезапно забыл родной язык и перешел на английский
Синдром чужого языка: у ученых пока нет никаких точных объяснений....

Ушел из жизни обезьяний Эйнштейн, бонобо Канзи
Он перевернул науку, показал, что язык — это не только слова, и научил, что значит быть другом....

Ровер NASA стреляет лазером по марсианскому камню и раскрывает древнюю тайну
Правда, от этого вопросов стало еще больше....

Любят бездыханных: зачем и как синеполосые осьминоги парализуют своих самок
Ответ и на поверхности, и в глубине инстинктов....

Йеллоустонский детектив: генетики раскрыли главную тайну бизонов
Как гиганты из двух «разных миров» сумели слиться в единое стадо....

Почему стеклянные бутылки лопаются в морозилке? Это не то, что мы думали
Роль играет… жидкость, запертая в жидкости....

Изучая мадагаскарских лемуров, ученые нашли ключ к вечной молодости?
Оказалось, что во время сна зверьки «чинят» свои клетки. Осталось включить этот механизм у людей....

Как похитителям идей помогает невнимательность гениев
Затем плагиаторы процветают....

Прощай, «Фотошоп»? Новый ИИ от Google редактирует фото после текстовых запросов
Ещё один шаг в развитии генеративных технологий....

Новая батарея для электромобилей заряжается за 5 минут
Это почти как залить бензин....

Конкурент Starlink: китайский SpaceSail ускоряет развёртывание спутников
Стартовала гонка в сфере космической связи....

Переписываем историю: Стоунхендж больше не самый древний круглый памятник в Англии
Археологи доказали: комплекс Флэгстоунс является его «дедушкой», так как старше на 200 лет....

Самцы опаснее: одичавшие домашние кабаны разносят по Австралии болезни
Вырвались из-под контроля....

Оказывается, античные скульптуры благоухали
Древние греки и римляне не только расцвечивали, но и ароматизировали статуи....