外媒报道:考古学家利用人工智能翻译5000年前的楔形文字泥板

一个由考古学家和计算机科学家组成的团队创建了一个人工智能程序,该程序可以利用神经机器学习翻译功能,即时翻译古代楔形文字泥板。

在牛津大学出版社出版的《PNAS Nexus》杂志上发表的一篇论文中,研究人员应用该人工智能程序高精度地翻译了阿卡德文。

阿卡德语是一种古老的东闪米特语言,曾在古代美索不达米亚的多个地区使用,包括阿卡德、亚述、伊辛、拉尔萨、巴比伦,可能还有迪尔蒙。

这种语言保存在可追溯到公元前2500年的泥板上,是用楔形文字书写的,这种文字是从苏美尔人那里学来的,是用湿粘土压制的楔形符号书写的。据研究人员称 用楔形文字书写的数十万块泥板记录了古代美索不达米亚的政治、社会、经济和科学史。

然而,由于数量庞大,能够阅读这些文件的专家人数有限,因此这些文件中的大部分仍未得到翻译,也无法查阅。

人工智能程序在翻译阿卡德语正式文本时具有很高的准确性,例如遵循一定模式的皇家法令或预兆。而更多的文学和诗歌文本,如祭司的信件或小册子,则更容易出现 "幻觉"--这是一个人工智能术语,意思是机器生成的结果与所提供的文本字面意思无关。将阿卡德语翻译成英语的神经机器翻译(NMT)的目标是成为人机合作的一部分,通过创建一个管道来帮助学者或古代语言的学生。

目前,NMT模型可在在线笔记本上查阅,源代码已在Akkademia的GitHub上公布。

研究人员目前正在开发一款名为 "巴比伦引擎 "的在线应用程序。

页码https://doi.org/10.1093/pnasnexus/pgad096

楔形文字是人类历史上最早的书写系统之一(约公元前3400年至公元75年)。

在过去的两个世纪中发现了成千上万的楔形文字,其中大部分是用苏美尔语和阿卡德语书写的。我们利用自然语言处理(NLP)方法(如卷积神经网络(CNN))展示了帮助学者和感兴趣的普通人,自动将阿卡德文从楔形文字Unicode字形直接翻译成英文(C2E)和从音译翻译成英文(T2E)的巨大潜力。

我们的研究表明,从楔形文字直接翻译成英语可以获得高质量的译文,因为我们在C2E和T2E中分别获得了36.52和37.47的最佳双语评估研究4(BLEU4)得分。对于C2E,我们的模型比翻译记忆基线好9.43,而对于T2E,差距更大,达到13.96。

该模型在中短篇句子(约118个字符或更少)中取得了最佳结果。随着数字化文本数量的增加,该模型可以通过进一步的训练作为人工在环系统的一部分加以改进,从而修正结果。

标题图片来源:Mbzt - CC BY 3.0

展开阅读全文

页面更新:2024-03-01

标签:楔形文字   美索不达米亚   人工智能   巴比伦   德文   在线   德语   考古学家   研究人员   模型   文本   年前

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top