赫庫蘭尼姆曾被公元79年的火山爆發(fā)所掩埋,18世紀(jì)出土的赫庫蘭尼姆卷軸已被燒焦,研究者通過AI技術(shù)識別出其中內(nèi)容,包含了希臘哲學(xué)家對快樂的思考。
這一成就點(diǎn)燃了通常進(jìn)展緩慢的古代研究世界。除了數(shù)百份等待識別的赫庫蘭尼姆卷軸外,AI也可用于研究包裹木乃伊的材料上的信息,揭示普通古埃及人的生活。
這十五列文本來自能夠閱讀的第一卷卷軸的末尾。該卷軸仍有大約95%待閱讀。
人工智能技術(shù)可能對我們理解古代世界產(chǎn)生革命性的影響。
大約2000年前,維蘇威火山噴發(fā)掩埋了一部燒焦的莎草紙卷軸,一組學(xué)生研究人員最近利用AI破譯了其中的希臘文字內(nèi)容,發(fā)現(xiàn)一部此前不為人知、討論快樂的哲學(xué)作品。
當(dāng)?shù)貢r間2月5日,“維蘇威挑戰(zhàn)賽”賽事官方宣布,破解莎草紙卷軸文本的3名學(xué)生來自埃及、瑞士和美國,分享了70萬美元大獎。他們識別了卷軸上的2000多個希臘字母,相當(dāng)于一份卷軸5%的內(nèi)容。這一成就點(diǎn)燃了通常進(jìn)展緩慢的古代研究世界,學(xué)者們認(rèn)為,這將使古希臘和古羅馬詩歌、戲劇和哲學(xué)作品的發(fā)現(xiàn)量成倍增加。
“其中一些文本可能會完全改寫古代世界關(guān)鍵時期的歷史。”古典學(xué)家、赫庫蘭尼姆協(xié)會主席羅伯特福勒(Robert Fowler)對媒體表示, “這就是現(xiàn)代西方世界的起源社會。”
AI識別碳化的上古卷軸
赫庫蘭尼姆(Herculaneum)卷軸藏于意大利赫庫蘭尼姆一座豪華羅馬別墅的圖書館中,于18世紀(jì)出土。赫庫蘭尼姆被稱為“時光凍結(jié)之城”,與龐貝古城都被公元79年的維蘇威火山爆發(fā)所掩埋。該別墅被認(rèn)為屬于凱撒的岳父、參議員盧修斯卡爾普爾尼烏斯皮索卡索尼努斯(Lucius Calpurnius Piso Caesoninus)。這座圖書館是古羅馬時代遺留下來的唯一一座圖書館,這些碳化的卷軸也是古羅馬時代保存下來的珍貴藏書。
1752年在赫庫蘭尼姆考古發(fā)掘中首次發(fā)現(xiàn)了約1800份卷軸。在被發(fā)現(xiàn)后的幾個世紀(jì)里,人們試圖打開這些發(fā)黑的卷軸,結(jié)果一部分卷軸被毀,變成碎片。這些古老的卷軸大多保存在意大利那不勒斯國家圖書館,少部分保存在巴黎、倫敦和牛津。
直接展開卷軸的后果就是卷軸變得稀碎。
美國肯塔基大學(xué)計(jì)算機(jī)科學(xué)家、“維蘇威挑戰(zhàn)賽”聯(lián)合創(chuàng)始人布倫特西爾斯(Brent Seales)近20年來一直試圖解讀這些文本,希望打開這座“隱形圖書館”。他的團(tuán)隊(duì)開發(fā)了以數(shù)字方式打開卷軸的軟件,用三維計(jì)算機(jī)斷層掃描(CT)圖像“虛擬地打開”卷起來的莎草紙。但繪制卷軸的表面圖像耗時,而且在CT掃描中,用于書寫卷軸的碳基墨水與莎草紙的密度相同,因此無法在成像中進(jìn)行區(qū)分。
西爾斯團(tuán)隊(duì)想知道機(jī)器學(xué)習(xí)模型是否可以被訓(xùn)練來“打開”卷軸并區(qū)分出墨水,但這項(xiàng)工程對他的小團(tuán)隊(duì)來說是一個艱巨的任務(wù)。所幸,硅谷企業(yè)家納特弗里德曼(Nat Friedman)找到了西爾斯,建議開放挑戰(zhàn),還捐贈了一筆錢。
2023年3月,“維蘇威挑戰(zhàn)賽”正式發(fā)起。賽事設(shè)定了一個大獎,要求在2023年底前,在每段140個字符、總共4段文字中,破譯85%以上的字符。實(shí)際上賽事提供了2000多個字符供識別。西爾斯團(tuán)隊(duì)則向公眾發(fā)布了掃描結(jié)果和代碼。
一項(xiàng)關(guān)鍵的創(chuàng)新出現(xiàn)在去年年中,當(dāng)時美國企業(yè)家和前物理學(xué)家凱西漢默(Casey Handmer)在掃描中注意到一種微弱的紋理,這種紋理形成了希臘字母的形狀。
就讀于美國內(nèi)布拉斯加大學(xué)林肯分校的21歲本科生盧克法里托(Luke Farritor)利用這些紋理訓(xùn)練機(jī)器學(xué)習(xí)算法,發(fā)現(xiàn)了古希臘語“porphyras”,意為“紫色”,獲得了大獎。在柏林的埃及博士生優(yōu)素福納德(Youssef Nader)以更清晰的圖像緊隨其后,獲得第二名。與法里托、納德同屬一個團(tuán)隊(duì)的還有蘇黎世聯(lián)邦理工學(xué)院機(jī)器人專業(yè)的學(xué)生朱利安席利格(Julian Schilliger)。這些圖像被披露出來以后,莎草紙古文稿學(xué)者們開始爭分奪秒地分析文本。
被識別文本探討快樂來源
赫庫蘭尼姆別墅里奢華的圖書館藏書頗豐,此前一些已知的卷軸內(nèi)容是伊壁鳩魯學(xué)派的希臘哲學(xué)家菲洛德謨(Philodemus)的作品。
一份正面和背面都有希臘文的卷軸曾經(jīng)被成像技術(shù)識別出隱藏的內(nèi)容,研究成果2019年發(fā)表在《科學(xué)進(jìn)展》雜志上。那份卷軸上的內(nèi)容是《學(xué)院歷史》的草稿,而這份草稿的作者正是菲洛德謨。
先前被打開的赫庫蘭尼姆卷軸的大部分內(nèi)容都與伊壁鳩魯哲學(xué)學(xué)派有關(guān)。盡管此次被識別的文本沒有提到作者的名字,但福勒認(rèn)為,作者仍是菲洛德謨,“風(fēng)格非常粗糙,是他的典型特征,主題是他擅長的。”
獲獎?wù)咦R別出的卷軸。
識別出的幾段文本揭示了哲學(xué)家對快樂的思考食物和其他物品的稀缺或豐富如何影響它們帶來的快樂。
文本討論了快樂的來源,涉及音樂和食物,也討論了從各種元素組合中體驗(yàn)到的快樂是歸功于主要部分還是次要部分、是豐富還是稀缺。“就食物而言,我們不會馬上相信稀缺的東西一定比豐富的東西更令人愉快。”作者寫道。
“我認(rèn)為他在問這樣一個問題:在各種各樣的事物中,快樂的來源是什么?是主導(dǎo)元素、稀缺元素,還是兩者混合本身?”福勒解讀稱。
而其余卷軸中可能蘊(yùn)藏更多的希臘哲學(xué)。據(jù)《自然》報(bào)道,一些已經(jīng)被打開的拉丁文卷軸覆蓋了更廣泛的主題,很可能找到希臘詩人荷馬和薩福遺失的詩歌和文學(xué)作品。
“這是赫庫蘭尼姆莎草紙學(xué)和希臘哲學(xué)革命的開始。” 那不勒斯費(fèi)德里科二世大學(xué)莎草紙古文稿學(xué)者費(fèi)代麗卡尼古拉迪(Federica Nicolardi)表示。
挑戰(zhàn)賽的下一步是破譯整部作品。弗里德曼已經(jīng)宣布了2024年的“維蘇威挑戰(zhàn)賽”,第一個能夠識別已經(jīng)掃描出的四個卷軸的至少90%的團(tuán)隊(duì),將獲得10萬美元大獎。研究人員需要完全自動化追蹤每卷莎草紙表面,并提高對受損最嚴(yán)重部分的墨水檢測。
除了數(shù)百份等待識別的赫庫蘭尼姆卷軸外,此次研究成果也意味著,機(jī)器學(xué)習(xí)技術(shù)可用于研究其他類型的隱藏文本,如包裹在木乃伊上的莎草紙,上面的信息可能包括信件、房契、洗衣單和稅收收據(jù)等內(nèi)容,可揭示普通古埃及人的生活。
此次成果也可能引發(fā)是否應(yīng)對赫庫蘭尼姆別墅進(jìn)一步調(diào)查的爭論。赫庫蘭尼姆別墅的整個樓層從未被挖掘過,福勒和美國密歇根大學(xué)安娜堡分校莎草紙古文稿學(xué)者理查德?lián)P科(Richard Janko)確信,別墅的主圖書館從未被發(fā)現(xiàn),地下可能還有數(shù)千卷卷軸。