Система может революционизировать изучение иероглифов и предоставить мгновенные переводы текстов в музеях для понимания древних культур.
Ученые из Института искусственного интеллекта AIRI вместе с коллегами разработали уникальную систему, способную с высокой точностью распознавать и переводить древнеегипетские иероглифы. Для обучения модели использовалась база данных Thesaurus Linguae Aegyptiae. Она представляет собой наиболее полное собрание древнеегипетских текстов с переводами. Первоначально применялись автоматические метрики оценки качества перевода, после чего полученные результаты были проверены профессиональными египтологами из НИУ ВШЭ.
Распознавание иероглифов представляет собой сложную задачу, поскольку вместо стандартного алфавита из 30−40 букв система должна уметь интерпретировать сотни уникальных символов, каждый из которых имеет свое собственное значение. Чтобы повысить точность распознавания, ученые применяли контекстуально-зависимые OCR-модели и диффузионные модели, способные генерировать реалистичные изображения для расширения обучающего набора.
«Проект стал результатом работы междисциплинарной команды специалистов по машинному обучению и египтологии. Первую научную работу, посвященную разработке метода, мы уже представили на международной конференции SIGGRAPH 2025. На данный момент доступ к системе открыт по запросу для заинтересованных специалистов», — заключает руководитель проекта, ведущий научный сотрудник ИСП РАН и AIRI, доцент ИТМО Илья Макаров.
Ученые из Института искусственного интеллекта AIRI вместе с коллегами разработали уникальную систему, способную с высокой точностью распознавать и переводить древнеегипетские иероглифы. Для обучения модели использовалась база данных Thesaurus Linguae Aegyptiae. Она представляет собой наиболее полное собрание древнеегипетских текстов с переводами. Первоначально применялись автоматические метрики оценки качества перевода, после чего полученные результаты были проверены профессиональными египтологами из НИУ ВШЭ.
Распознавание иероглифов представляет собой сложную задачу, поскольку вместо стандартного алфавита из 30−40 букв система должна уметь интерпретировать сотни уникальных символов, каждый из которых имеет свое собственное значение. Чтобы повысить точность распознавания, ученые применяли контекстуально-зависимые OCR-модели и диффузионные модели, способные генерировать реалистичные изображения для расширения обучающего набора.
«Проект стал результатом работы междисциплинарной команды специалистов по машинному обучению и египтологии. Первую научную работу, посвященную разработке метода, мы уже представили на международной конференции SIGGRAPH 2025. На данный момент доступ к системе открыт по запросу для заинтересованных специалистов», — заключает руководитель проекта, ведущий научный сотрудник ИСП РАН и AIRI, доцент ИТМО Илья Макаров.