DeepMind/威尼斯大学Nature: 填补空白，使用深度神经网络破译古代文字！

古代史研究依赖于诸如金石学之类的学科，即研究铭文并将其作为古代文明思想、语言、社会和历史的证据。然而，几个世纪以来，许多铭文已经被损坏到难以辨认的程度，或是被运到远离其原始位置的地方，而且其书写日期也充满了不确定性。然而，用于修复和归因铭文的传统金石学方法涉及高度复杂、耗时且专业的工作流程。

在此，英国DeepMind公司Yannis Assael、意大利威尼斯大学Thea Sommerschield等人通过使用最先进的机器学习方法克服了当前金石学研究的限制，受生物神经网络的启发，深度神经网络可以在大量数据中发现和利用复杂的统计模式。作者展示了一种经过训练的名为Ithaca（伊萨卡，古希腊神话英雄奥德修斯的故乡）的深度神经网络架构，可以同时执行文本恢复、地理/时间归因的任务。

该架构以公元前7世纪到公元5世纪期间的古希腊语言和整个古代地中海世界的铭文进行训练，数据集来源于帕卡德人文学院（PHI），由178551 个铭文的转录文本组成。这种选择主要有两个原因：首先，希腊铭文记录的内容和上下文的可变性，这使其成为语言处理的绝佳挑战；其次，古希腊语的数字化语料库是训练机器学习模型的重要资源。

图1. Ithaca架构处理流程示例

为了应对部分文字丢失的挑战，作者将字符和单词的共同表示作为Ithaca的输入，用特殊符号“[unk]”表示损坏、丢失或未知的单词。研究表明，该架构侧重于协作、决策支持和可解释性。虽然历史学家、Ithaca在单独修复受损文本时仅分别达到25%、62% 的准确率，但二者结合修复的准确率可提高至72%，证实了该研究工具的协同效应。

此外，Ithaca实现了以71%的精确度将铭文定位到其原始地理位置，且将其年代追溯到距其真实年代范围不到30年的时间，从而重新编辑了古典雅典的关键文本并为古代史上的专题辩论做出了贡献。这项研究展示了Ithaca模型如何促进AI和历史学家之间的合作，从而彻底影响人类历史上最重要时期之一的研究和撰写。

图2. Ithaca架构的输出结果示例

Restoring and attributing ancient texts using deep neural networks, Nature 2022. DOI: 10.1038/s41586-022-04448-z

点击阅读原文，提交计算需求！

原创文章，作者：v-suan，如若转载，请注明来源华算科技，注明出处：https://www.v-suan.com/index.php/2023/10/11/2c989006e2/

DeepMind/威尼斯大学Nature: 填补空白，使用深度神经网络破译古代文字！

相关推荐

发表回复