展會(huì)信息港展會(huì)大全

古文字考釋與人工智能
來源:互聯(lián)網(wǎng)   發(fā)布日期:2020-11-07 20:34:38   瀏覽:7302次  

導(dǎo)讀:作者:吳振武(吉林大學(xué)考古學(xué)院教授、博士生導(dǎo)師) 人工智能+已經(jīng)跟很多行業(yè)發(fā)生關(guān)系。據(jù)人工智能專家介紹,凡是邊界清楚的問題,最適宜用人工智能來解決。因此,像古文字考釋這種道理上只允許存在一種正確結(jié)論的學(xué)問,利用人工智能技術(shù)來輔佐研究,自然再...

作者:吳振武(吉林大學(xué)考古學(xué)院教授、博士生導(dǎo)師)

“人工智能+”已經(jīng)跟很多行業(yè)發(fā)生關(guān)系。據(jù)人工智能專家介紹,凡是邊界清楚的問題,最適宜用人工智能來解決。因此,像古文字考釋這種道理上只允許存在一種正確結(jié)論的學(xué)問,利用人工智能技術(shù)來輔佐研究,自然再適合不過。事實(shí)上,古文字行業(yè)大概在30多年前,已有學(xué)者在探索利用計(jì)算機(jī)幫助綴合那些破碎的甲骨片子。最近看到“AI驅(qū)動(dòng)的甲骨綴合”報(bào)道,是古文字學(xué)家和計(jì)算機(jī)專家合作,利用人工智能技術(shù)綴合了一批甲骨碎片,似乎相當(dāng)準(zhǔn)確。而諸如圖像捕捉與提娶字形識(shí)別與轉(zhuǎn)換、數(shù)據(jù)聚合與分類等與人工智能有關(guān)的工作,也都有學(xué)者在努力研究,并都有喜人突破。其目的都是希望靠計(jì)算機(jī)來解決人工做起來十分煩瑣且不容易準(zhǔn)確的工作。

這里舉幾個(gè)自己以往考釋古文字的例子,來說明人工釋讀古文字的很多關(guān)鍵點(diǎn)今后是完全有可能利用人工智能技術(shù)去幫助解決的。

第一,古文字中有些字,形體非常接近,卻是不同的兩個(gè)字。

圖一

如甲骨文、金文中的“”和“替”,差別只在它們所從的兩個(gè)“立”,一是左右并排(),一是高低錯(cuò)落(替)。楚文字中的“之”和“出”,差別只在最底下一筆,一作平畫(之),一作上彎形(出)。歷史上,在學(xué)者正確分辨出來之前,“替”字都被誤釋成“”;而楚國印章中的“出”,也多被誤釋為“之”,致使一些重要商業(yè)史料被湮沒。20世紀(jì)30年代,在洛陽金村出土的一批青銅方壺上,都有記錄容量和重量的銘刻。在容量“四斗”之后,有“[~符號(hào)~]([~符號(hào)~])客”二字,過去多有誤釋,目前最流行的釋法就是釋為官名“[~符號(hào)~](司)客”。我多年前曾在一次演講中指出,“客”前一字,跟“[~符號(hào)~]”字是有區(qū)別的。其所從的[~符號(hào)~],不但比“司”字所從的[~符號(hào)~]少一畫,連首筆的斜度,也就是筆勢,二者都是不同的。這個(gè)字實(shí)際上就是“以”字。釋作“以”,不但字形上解釋起來毫無障礙,文意也極為通暢。“以客”要讀作“已格”,就是已經(jīng)校量過了的意思。“以”讀“已”,在古書中本是很常見的,而“客”與“格”的通假,早在西周銅器銘文中就已出現(xiàn)過了。近年新出的好幾件記容銅器上,都發(fā)現(xiàn)“客”讀作“格”(度量)的例子。而三晉記容銅器銘刻中,也曾出現(xiàn)過“已[~符號(hào)~](校)”這樣的話。所以金村方壺銘文中這兩個(gè)字的正確釋讀,一定是“以(已)客(格)”,而不能是其他。這種字形上的細(xì)微差別,往往是誤導(dǎo)學(xué)者釋讀的一個(gè)重要原因。

第二,即使字都不難認(rèn)識(shí),但因某些特殊情況的存在,也會(huì)導(dǎo)致人眼的疏忽,進(jìn)而導(dǎo)致錯(cuò)誤的釋讀。

圖二

過去我曾講過一個(gè)反書的例子:徐國青銅器上曾出現(xiàn)過“魚臘”(臘音昔,干肉),這是古代禮書上常見的連舉名物,但因“魚”字在銘文中是反寫的(與銘文鑄造有關(guān)),結(jié)果導(dǎo)致各種各樣的誤釋,致使我們喪失一次古代禮制方面的“二重證據(jù)”機(jī)會(huì)。這里再舉一例:《古璽匯編》2238號(hào)是一枚三晉陽文小方。▓D一),舊以為其上只有三個(gè)字,定為私櫻我在2006年審讀一篇博士學(xué)位論文時(shí)曾指出,此印實(shí)際上是五個(gè)字,前兩個(gè)字的下部,都含有合文符號(hào)“=”(兩個(gè)字合在一起占一個(gè)字的地位,稱為合文)。只是因?yàn)橛∶娴匚华M窄,加上所有文字都并排橫列,所以看起來非常隱晦,以致一般研究的人都會(huì)疏忽放過。正確的釋讀應(yīng)該是“曲邑勻邑守”,是一方很特殊的官櫻過了11年,2017年,陜西收藏家公布了一方新發(fā)現(xiàn)的類似三晉官印,印文是“曲邑武陰守”,其上“曲邑”二字也同樣作合文并有合文符號(hào)(《戎壹軒藏三晉古璽》),證實(shí)了我之前的看法(圖二)。

第三,窮盡資料,并盡可能地縮小考釋范圍,是準(zhǔn)確考釋古文字的一個(gè)重要途徑。

在三晉璽印所見的姓氏中,有一個(gè)怪字作[~符號(hào)~],它既作為單字姓氏出現(xiàn),又出現(xiàn)在復(fù)姓中(這里用俗稱,實(shí)際是氏)。過去曾有學(xué)者釋為“佗”,字形上雖然也馬馬虎虎可以通過,但實(shí)際上解決不了跟已知古代姓氏的對應(yīng)問題。也就是說,這樣的考釋最終還是無法落實(shí)。后來我在檢閱舊材料時(shí)發(fā)現(xiàn),這個(gè)怪字在復(fù)姓中,不但出現(xiàn)在后一個(gè)字的位置上,如“大~”;也出現(xiàn)在前一個(gè)字的位置上,如“~中”。這樣一來,釋讀的可能范圍便大大縮小了。于是我檢查了所有已知復(fù)姓,最終知道此字實(shí)際上就是古文字里很常見的當(dāng)“叔”字用的“”,只是它的寫法在三晉變異了。“大叔”氏、“叔中”氏和“叔”氏,不但見于傳世文獻(xiàn)(即太叔、叔仲),也見于漢代私櫻后來我又在魏國兵器上發(fā)現(xiàn)同樣寫法的“梁”氏,那自然就讓我們馬上想起孔子的老爸名紇字叔梁。晉有叔梁氏,是見于古姓氏書記載的。

以上幾個(gè)古文字考釋的例子,如利用人工智能技術(shù),大約涉及:(1)手寫漢字字形的精準(zhǔn)圖像識(shí)別,含反書、合文、重文等特殊情形;(2)語料庫的建設(shè),含通假標(biāo)識(shí)與斷句等;(3)古代歷史與制度的相關(guān)數(shù)據(jù)庫建設(shè)。假使通過計(jì)算機(jī)讀圖并與各種相關(guān)的“庫”建立起有效的勾連與篩選,也就是通過人工智能技術(shù)達(dá)到較為精準(zhǔn)有效的數(shù)據(jù)處理,那么古文字考釋的速度與成效自然會(huì)大大提高。雖說這些恐怕還都屬于比較低端的人工智能,未來一定還會(huì)有更高級的諸如機(jī)器自我學(xué)習(xí)提升以及人機(jī)嫁接互動(dòng)等技術(shù),但這已是我們當(dāng)下可以憧憬和努力的方向了。

《光明日報(bào)》( 2020年11月07日 12版)

來源:光明網(wǎng)-《光明日報(bào)》


贊助本站

相關(guān)熱詞: 古文字 考釋 人工智能

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港