海归学者发起的公益学术平台
分享信息,整合资源

交流学术,偶尔风月
维苏威火山位于意大利南部那不勒斯湾东海岸,是世界著名的火山之一,因为在最近1万年内多次喷发而被称为“欧洲最危险的火山”。公元79年10月24日,维苏威火山突然大爆发,灼热的火山碎屑流毁灭了当时极为繁华、拥有2万居民的庞贝古城,其他几个有名的海滨城市如赫库兰尼姆、斯塔比亚等也遭到严重破坏。在那之后人们在庞贝和赫库兰尼姆的遗址中找到了许多古代莎草纸卷轴,这些文献已经在高温下被碳化了,但是人们相信这些古代卷轴有着非同寻常的价值,一直在努力试图辨认其中的内容。
维苏威火山毁灭了附近的城市
图源:https://scrollprize.org/
与著名的庞贝古城不同,海滨城市赫库兰尼姆的规模要小一些,但是人们在这里找到的古代遗存要更加丰富,更有价值。1750年,在考古发掘中找到了现在被称为纸莎草别墅的巨大海滨豪宅,里面发现的数十座青铜和大理石雕像,证明了这座豪宅的人的财富和品味:它很可能属于朱利叶斯·凯撒(对,就是那个凯撒)的老丈人——卢修斯·卡尔普纽斯·皮索。然而最有价值的财富则是在一个排列木架子的小房间里找到的。在两年的时间里,从中整理出了大约1000份卷轴,其中很多已经是碎片了。而其中保存状态稍好的,也因为高温成了下面这副样子。
图源:https://scrollprize.org/
如何辨认这些卷轴的内容呢?两百多年来人们尝试了很多办法,早期的技术只能试图展开它们。意大利画家卡米洛·帕德尼(Camillo Paderni)曾尝试将卷轴切成两半,一层层去除莎草纸并誊写尚可辨别的文本,但这种方法破坏性极大且收效甚微。之后意大利学者安东尼奥·比亚乔(Antonio Piaggio)有了新的思路,他设计了一个特殊的机器,帮助人们以极慢的速度逐渐展开卷轴:慢到展开第一个卷轴就用了四年时间,有一些卷轴被成功的打开了,但是也有很多卷轴都被撕成了细条,又毁掉了不少文物。英国化学家汉弗莱·戴维(Humphry Davy)于1819年访问了那不勒斯,并试图用硫磺、碘和氯来“熏蒸”这些卷轴然后展开,也没有成功。
图源:https://scrollprize.org/
在那些能够辨认出的卷轴中,历史学家找到了伊壁鸠鲁、德美特里乌斯·拉康及其他一些著名的伊壁鸠鲁学派学者的作品,还有卢克莱修《自然咏》诗中的一段唱词;其中的一些文献还提到了欧里庇德斯、索福克勒斯、荷马、萨福等人业已失传的一些作品。这些文献对于研究罗马时期希腊化的哲学思想非常重要,因此历史学家们对剩余的六七百份卷轴充满了期待,希望科技的进步能够帮助他们解读出更多的内容。
2009年,肯塔基大学的计算机学家布伦特·西尔斯(Brent Seales)首次尝试用X射线对两个烧焦卷轴进行扫描。扫描获得的图像显示当时的热风将莎草纸紧密的粘连在了一起,他们试图用数字方式虚拟展开这些卷轴,但是其内部非常混乱的结构很难精确建模,同时由于卷轴的书写材料是碳基墨水,与莎草纸本身的成分非常近似,对X射线的吸收程度差不多,难以区分。
图源:https://scrollprize.org/
那不勒斯微电子和微系统研究所的物理学家 Vito Mocella 则尝试实用X射线相衬断层扫描,它的工作原理是检测材料如何折射而不是吸收X射线的对比度。而之前的样本显示,这些卷轴上的字迹高出莎草纸表面约0.1毫米,这个凸起足以产生可辨认的图像。这个方法辨认出了一些希腊字母和单词,但是识别率很有限。
2020年初,著名网站GitHub的前首席执行官奈特·弗里德曼(Nat Friedman)在疫情隔离期间读了《古罗马二十四小时》后,他对庞贝等古罗马遗址产生了浓厚的兴趣。他得知赫库兰尼姆卷轴的存在,便联系了布伦特·西尔斯(Brent Seales)。美国企业家丹尼尔·格罗斯(Daniel Gross)对此也很感兴趣,今年3月,他们三人联合发起了一个名为“维苏威火山挑战赛”(Vesuvius Challenge)的项目,设立了总价值达百万美元的不同奖项,鼓励全世界一起探寻赫库兰尼姆卷轴中的秘密。
布伦特·西尔斯(Brent Seales)并未放弃努力,2016年,他成功的对以色列En-Gedi出土了一个烧焦的卷轴进行了“虚拟展开”,这份卷轴上的墨水含有金属,与卷轴材料羊皮纸对X射线的吸收程度差别很大,从而显示出亮度的差异。经研究人员破译,这份卷轴是希伯来圣经的五部经典之一——《摩西五经》(The Pentateuchal)中《利未记》的部分内容,这是犹太律法和基督教旧约的一部分,写于公元3世纪或4世纪。
图源:Seales et al./Sci. Adv.
Brent Seales认为,即使亮度没有差异,CT扫描也可能捕捉到纹理的微小差异,从而区分涂有墨水的莎草纸区域。为了证明这一点,他训练了一个机器学习工具来读取赫库兰尼姆碎片的X射线图像中的字母。在2019年,他从巴黎的法国研究所携带了两个完整的卷轴到英国牛津的同步加速器X射线设备钻石光源,以最高的分辨率扫描它们(每个3D图像元素或体素4-8微米)。扫描获得了大量的数据,单靠几个团队可能需要很久才能将它们解读完毕,因此Seales 参加发起了“维苏威火山挑战赛”,向公众开放了所有的高精度扫描文件和代码,约有5.5TB的卷轴扫描文件和400GB的卷轴分割片段文件,以及用于训练墨水检测模型的卷轴碎片X射线扫描、红外图像和手工标记了文本的文件。项目网站还提供了扫描、分割、墨水检测等每一个步骤的详细教程,包括步骤原理和软件使用说明。因此,参赛者能够在先行者的基础上更快的开始工作,自由的拓展思路,开发更有效的识别算法工具。
图源:UK Photo
内布拉斯加大学林肯分校的卢克·法里托(Luke Farritor)成为了第一个获奖者,他开发了一种机器学习算法,在赫库兰尼姆的卷轴上检测到了希腊字母,包括πορφυρας(porphyras),意为“紫色”,这证明他的算法起作用了,在接下来的几天内将模型改进后,他辨认出了获奖所需的10个字母。文献学家也很兴奋,因为“紫色”一词尚未在打开的赫库兰尼姆卷轴中读到过,但是紫色染料在古罗马备受追捧,由海蜗牛的腺体制成,这个单词可以指紫色、长袍、负担得起染料的人的等级。
图源:UK Photo
Brent Seales 认为扫描技术加上丰富的AI工具,可能会打开一个前所未有的“隐形图书馆”:意思是很多文字符号在物理上是存在的,但是人们看不到。比如纸张在古代很昂贵,利用旧纸书写新的文字很常见,那些被覆盖掉的原始文字依然存在。还有很多纸张的碎片被用来制作其他物品,如古埃及木乃伊的盒子和面具。以及一些中世纪书籍的书皮,里面常常有不为人知的夹层。
同时对纸莎草别墅的考古发掘仍在进行,这个规模庞大的豪宅中还有两层没有清理完毕,之前发现一千余份卷轴的房间只是一个很小的储藏室,而属于主人日常使用的主阅览室也尚未发现,因此历史学家推测别墅下还埋有数千甚至数万卷古罗马时代的卷轴,这是可能是一处难以想象的古罗马文化的宝库。
推测中的“莎草纸别墅”全貌 
绘制:Rocío Espín
参考文献:
1. https://scrollprize.org/
2.https://www.nature.com/articles/d41586-023-03212-1
3.https://www.nature.com/articles/nature.2015.16763
点击下方知社人才广场,查看最新学术招聘
扩展阅读
翻开尘封的历史:AI帮忙重整欧洲数十亿页档案
AI古文大师问世,一键复原古代文献
数字新基建:用AI帮助人们整理海量的论文
本文系网易新闻·网易号“各有态度”特色内容
媒体转载联系授权请看下方
继续阅读
阅读原文