ВСЛУХ

«Порфирас»: ИИ прочитал первое слово внутри спечённого в одно целое свитка из Геркуланума

«Порфирас»: ИИ прочитал первое слово внутри спечённого в одно целое свитка из Геркуланума
Пропечённые свитки из Геркуланума невозможно размотать, но рентгеновское сканирование может выявить их содержимое. Всемирный конкурс по прочтению первого текста внутри обугленного свитка из древнеримского города Геркуланум выиграл 21-летний студент-информатик. Свиток дошёл до нас после извержения вулкана в 79 году нашей эры. Откопанный археологами неподалёку от Помпей, артефакт стал первым примером такого успеха. Научно-технологический прорыв может стать началом для прочтения сотен текстов из единственной библиотеки времён греко-римской античности, которая уцелела хотя бы отчасти.


Люк Фарритор из Университета Небраски в Линкольне разработал алгоритм машинного обучения, который распознал греческие буквы в нескольких строках из свёрнутого папируса, включая звучащее по-русски как «порфирас». Фарритор использовал едва заметные различия в толще артефакта, чтобы обучить свою нейронную сеть и выявить следы чернил.

Среди изучающих древности есть специальность папиролога, то есть специалиста по папирусным документам, и Федерика Николарди из Неаполитанского университета в Италии — одна из них.

Когда я увидела первое изображение, то была потрясена. Это было как во сне. Теперь я действительно могу видеть что-то внутри свитка

— Федерика Николарди, папиролог.

Сотни таких свитков были погребены при извержении вулкана Везувий в октябре 79 года н. э. Город Геркуланум оказался под слоем вулканического пепла толщиной 20 метров. Ранние попытки вскрыть папирусы привели к тому, что свитки рассыпались на кусочки. В дальнейшем учёные всерьёз опасались, что другие свитки, смятые, раздавленные и отвердевшие, никогда не удастся развернуть и прочитать.

Но вот появился стимул для всего мирового сообщества — Vesuvius Challenge («Вызов Везувия»). Суть в том, что разыгрывается серия наград, и за прочтение четырёх или более отрывков из обугленного свитка пообещали главный приз в 700 тыс. долларов США. Стимул сработал: 12 октября организаторы премии объявили, что Люк Фарритор выиграл приз в номинации «Первые буквы». Студент получит 40 тыс. $ за прочтение более 10 символов на папирусе площадью 4 квадратных сантиметра. Юсеф Надер, аспирант Свободного университета Берлина, занял второе место и получит 10 тыс. $.

Роскошная недобиблиотека


Наконец-то увидеть буквы и слова внутри свитка было очень интересно, прокомментировала Теа Соммершилд, историк Древней Греции и Рима из Венецианского университета Ка-Фоскари, Италия. Сами свитки нашли в XVIII веке, когда рабочие наткнулись на остатки роскошной виллы, предположительно, принадлежавшей тестю Юлия Цезаря. По словам Соммершилд, расшифровка папирусов может стать революцией в познаниях о древней истории и литературе. Дело в том, что большинство дошедших до нас классических текстов — это результаты многократного копирования переписчиками на протяжении веков. А библиотека Геркуланума содержит произведения, возможно, из-под пера самих авторов или близко к тому.

До сих пор папирологи могли исследовать лишь очевидные фрагменты из библиотеки Геркуланума. Таким образом обнаружили несколько работ на латыни, но большинство из них содержат греческие тексты, относящиеся к эпикурейской школе философии. Так, удалось выявить фрагменты книги «О природе», написанной самим Эпикуром.

А также частично прочитаны работы малоизвестного философа по имени Филодемус на темы пороков, музыки, риторики и смерти. Благодаря этому возникло предположение, что библиотека, возможно, когда-то была его личным собранием текстов для работы. Но это отчасти идентифицированное — лишь крохи. Остаются нетронутыми и нераспечатанными более 600 свитков, которые хранятся преимущественно в Национальной библиотеке Неаполя, и несколько — в Великобритании и Франции. Вероятно, ещё больше папирусов удастся раскопать на нижних этажах виллы в ходе дальнейших археологических работ.

«Порфирас»: ИИ прочитал первое слово внутри спечённого в одно целое свитка из Геркуланума


Организовать Vesuvius Challenge помог специалист по информатике Брент Силз из Университета Кентукки в Лексингтоне. Он с коллегами потратили годы на разработку методов «виртуального разворачивания» слоёв с помощью рентгеновской компьютерной томографии (КТ) и визуализации в виде читаемых изображений. В 2016 году Силз сообщил, что использовал эту технику для чтения обугленного свитка из Эн-Геди в Израиле. Тогда удалось распознать фрагменты Книги Левит, то есть части иудейской Торы и христианского Ветхого Завета, написанные в III или IV веке нашей эры. Но в чернилах на свитке Эн-Геди есть молекулы металла, поэтому письмена ярко светились при компьютерной томографии. Но чернила на папирусах Геркуланума сделаны на основе углерода, в основном из древесного угля и воды. Поэтому у них та же плотность при сканировании, что и у папируса, поэтому с помощью КТ они оказались вовсе не видны.

Затем Брент Силз предположил, что даже при отсутствии разницы в яркости КТ может зафиксировать крошечные различия в текстуре, по которым можно различить участки, покрытые чернилами. Чтобы доказать это, он обучил искусственную нейронную сеть считывать буквы на рентгеновских изображениях визуально доступных фрагментов из Геркуланума. Затем, в 2019 году, Силз перенёс два цельных свитка из Института Франции в Париже в Diamond Light Source, синхротронную рентгеновскую установку близ Оксфорда, Великобритания. В синхротроне их можно было отсканировать с наивысшим на сегодняшний день разрешением в 4–8 микрометров на воксель. Воксель — это элемент трёхмерных изображений, гибрид слов volumetric (объёмный) и pixel (пиксель).



Однако чтение неповреждённых свитков по-прежнему было сверхсложной задачей. Поэтому охотники за тайнами папирусов решили привлечь мировое сообщество и опубликовали все свои сканы и компьютерный код для широкой публики, тем самым запустив «Вызов Везувия».

Мы с товарищами все согласились, что скорее предпочли бы приступить к чтению того, что внутри, чем пытаться всё придержать для своих попыток распознать тексты

— Брент Силз, специалист по информатике.

Вскоре около 1500 желающих начали обсуждать и сотрудничать для проекта Vesuvius Challenge через платформу игровых чатов Discord. Призы придумывали поэтапно, и по мере достижения очередного успеха выпускался компьютерный код для выигрыша, на который каждый мог опираться. Студент Люк Фарритор всегда интересовался историей и в детстве самостоятельно выучил латынь, и потому тоже увлёкся этим занятием.

Параллельно команда Силза работала над виртуальным разворачиванием, предоставляя изображения сплющенных фрагментов для анализа участникам конкурса. Ключевой момент наступил в конце июня 2023-го: один из участников указал, что на некоторых изображениях чернила иногда видны невооружённым глазом в виде тонкой текстуры, которую вскоре окрестили «трещинками». Фарритор сразу же сосредоточился на этой особенности в поисках других намёков на буквы.

Однажды августовским вечером он гулял на вечеринке, когда получил уведомление о появлении в доступе нового фрагмента с особенно заметными «трещинками». Войдя в чат через смартфон, он запустил свой алгоритм на новом изображении. Час спустя, по пути домой, он взглянул на телефон и увидел на экране пять букв. Фарритор признался, что заскакал от восторга с мыслью «О боже, это действительно сработает». Затем ему понадобилось ещё лишь несколько дней, чтобы усовершенствовать модель и определить все десять букв, необходимых для получения приза.

В качестве заглавной картинки к этой публикации — скан с тем самым фрагментом папируса с греческими буквами на нём. Так первым словом, расшифрованным благодаря проекту «Вызов Везувия» стало греческое πορϕυρας (звучит «порфѝрас»), что означает «фиолетовый» или «пурпур».

Профессиональные папирологи были взволнованы. Слово со значением «фиолетовый», «пурпурный» ещё не встречалось им в доступных для прочтения свитках Геркуланума. Вообще, пурпурный краситель пользовался большим спросом в Древнем Риме. Его добывали из морских моллюсков-иглянок. Так что расшифрованный термин мог относиться и к пурпурному цвету, и к элитной одежде, и к классу самих людей, которые могли позволить себе такие вещи, и даже к тем самым хищным моллюскам. Но важнее, чем отдельное слово, — это сама по себе возможность что-либо прочитать таким способом, подчеркнула Федерика Николарди. Технологическое усовершенствование даёт учёным надежду восстановить текст всего свитка, включая название и автора, то есть шанс узнать содержание и датировать папирусы из Геркуланума.

Видимость невидимого


Яннис Ассаэль — штатный научный сотрудник британской компании Google DeepMind, которая занимается искусственным интеллектом (ИИ). Эксперт описал Vesuvius Challenge как «уникальный и вдохновляющий». Но это часть более широкого технологического сдвига, отметил он, в рамках которого ИИ всё больше помогает в изучении древних текстов. Например, в прошлом году Ассаэль и Соммершилд выпустили инструмент ИИ под названием Ithaca («Итака»). Он должен помочь учёным установить дату и происхождение пока ещё неопознанных древнегреческих надписей и внести варианты, заполнив пробелы в тексте. Теперь Яннис Ассаэль получает сотни запросов в неделю на разгадку слов из разных языков, от корейского до аккадского, который был в ходу в древней Месопотамии.

А Силз теперь надеется, что ИИ откроет то, что он называет «невидимой библиотекой». Речь о текстах, которые физически присутствуют, но никто не может их увидеть. Например, таков пергамент, который использовали в средневековых книжных переплётах. А также неочевидные надписи могут таиться на палимпсестах, то есть вторично использованных пергаментах, на которых более поздние надписи скрывают нижний слой. А ещё перспективны футляры для древнеегипетских мумий и масок — при изготовлении такой упаковки использовали обрывки старого папируса.

Однако пока всё внимание приковано к «Вызову Везувия». Главный приз в 700 тыс. $ разыгрывается до 31 декабря 2023-го. Брент Силз описывает настроения участников как «безудержный оптимизм». Люк Фарритор, например, уже запустил своё программное обеспечение на других участках того же свитка и уже предвкушает новые успехи.

Автор:

Использованы фотографии: nature.com; wikimedia.org

Мы в Мы в Яндекс Дзен
Как ИИ раскрывает секреты древних клинописных текстовВсё оказалось и дольше, и страшнее: жертвы последнего дня Помпеи медленно задыхались, прикрываясь от пепла одеждой