4年前,由微軟共同創(chuàng)辦人保羅.艾倫設(shè)立的艾倫人工智慧研究所舉辦的一場賽事中,超過700位電腦學(xué)者競相開發(fā)能通過美國8年級科學(xué)考卷的人工智慧,勝者將能獲得8萬美元獎金,然而最終無一達成目標。擁有常人所不能的知識量,過目不忘的AI,竟會被區(qū)區(qū)國、高中等級的考卷給難倒,或許很難讓人想像。但事實上證明,當時最先進、雜的AI系統(tǒng),連取得60分都有困難。因為不管學(xué)識含量再豐富,看不懂題目就一點意義也沒有了。不過,最近的AI研究終于攻克阻礙,艾倫人工智慧研究所新推出的AI系統(tǒng)「Aristo」成功跨越了這道門檻。且絕不是低空飛過,AI在美國8年級科學(xué)測驗中答對9成題目;12年級科學(xué)測驗中,也有8成的答題正確率。雖然這有一些「前提條件」──礙于目前AI系統(tǒng)的能力,研究人員刪除了與圖表、圖片有關(guān)的題目,因為這需要更高一層將語言理解、邏輯與電腦視覺結(jié)合的能力。
盡管如此,Aristo依舊深刻展現(xiàn)了人工智慧技術(shù)在理解語言脈絡(luò)、模擬人類決策邏輯上的重大進展。打造「數(shù)位版亞里士多德」,科學(xué)家讓AI寫考卷。早從2013年起,艾倫人工智慧研究所便著手開發(fā)Aristo,他們希望能打造出一個「數(shù)位版的亞里士多德」,研究人員認為,比起傳統(tǒng)讓AI下棋的作法,給它們寫科學(xué)考卷更具訓(xùn)練意義。
研究人員指出,對考題的理解并非依靠學(xué)習(xí)規(guī)則就能掌握的,需要AI運用邏輯連結(jié)不同事物之間的關(guān)聯(lián)性,就像森林大火增加,就可能造成果實、昆蟲的數(shù)量銳減,進而導(dǎo)致松鼠死亡。Aristo的基礎(chǔ)源自一套由Google建立,名為Bert的自然語言處理模型。在徹底研讀維基百科數(shù)千篇條目,以及大量浪漫小說、科幻小說與自行出版書籍后,Bert開始學(xué)會如何推測句子中闕漏的字詞。借由這項訓(xùn)練,Bert學(xué)會了語言的基本建構(gòu)方式,而研究人員則給予Bert更廣泛的問題與答案,漸漸地,它也學(xué)習(xí)到如何解答類似的問題。
雖然Aristo距離學(xué)者的終極目標:模擬人類智慧,還有一大段距離,目前展現(xiàn)的研究成果,已經(jīng)足以開創(chuàng)商業(yè)應(yīng)用上的潛力。研究所負責人奧倫.埃齊奧尼(Oren Etzioni)對此頗具信心,「我能說的是,你將見識新世代產(chǎn)品的誕生,部分源自新創(chuàng),另一部分則源自大企業(yè)。」這些自然語言處理模型,如今已成為許多研究項目的核心,例如用于識別假新聞的工具,以及聊天機器人使用的對話系統(tǒng)。水能載舟,亦能覆舟,也有人擔心,有辦法熟練運用語言的AI,反倒可能助長假新聞散播。
無論如何,這項技術(shù)的潛力太過龐大,沒有人敢為其未來做出定論。另一間AI研究室Fast.ai研究人員杰瑞米.霍華德(Jeremy Howard)就表示,目前仍處于技術(shù)的早期階段,還未探索到其真正的潛力,這項技術(shù)最終將抵達何方,可能還沒有人知道。在美國以外,世界各地也有不少科學(xué)家將AI研究的目光,放在做考卷身上。
2017年時,中國也曾進行了一場AI與「學(xué)霸」們的高考數(shù)學(xué)比試,最終AI獲得134分,以1分之差惜敗精英學(xué)生組的成績平均,但仍向外界揭露AI在做考卷這檔事上,已經(jīng)越來越上手。