Читать нас в Telegram
Иллюстратор: Женя Родикова

Этой весной международная группа исследователей представила систему для реставрирования древних текстов на греческом языке. После восстановления надписей нейронная сеть Ithaca устанавливает вероятное время и место появления источника. 

Глубокая сеть, названная в честь родины легендарного Одиссея, обучена на датасете из более чем 170 тысяч расшифрованных надписей. Основная часть Ithaca базируется на архитектуре нейронной сети под названием transformer 22. Она, использует так называемый механизм внимания для поиска взаимосвязей между различными частями входных и выходных данных. 

Далее выходные данные проходят через три вершины нейросети: восстановление исходного текста, атрибуция местоположения и установление хронологических рамок текстовых данных. Каждая из частей состоит из отдельной нейронной сети с механизмом прогнозирования событий, специально обученной для конкретной задачи. Предложения сети ранжируются по степени вероятности. 

Несмотря на то, что в основе используются предыдущие наработки, а именно, рекуррентная нейронная сеть Pythia 15, результаты работы подвергаются сверке с прогнозируемой последовательностью реставрируемого текста. Предложенный метод может использоваться не только в эпиграфике, но и в других дисциплинах, где исследуются древние тексты на разных языках. Более того, возможно интегрировать такие дополнительные метаданные, как изображения надписей или стилометрические данные.

Источники: 

https://twitter.com/TSommerschield/status/1501605121712656384Restoring and attributing ancient texts using deep neural networks | Nature