展會信息港展會大全

AI報告:機(jī)器翻譯放大社會偏見,全球倫理相關(guān)出版物增五倍
來源:互聯(lián)網(wǎng)   發(fā)布日期:2022-03-31 11:59:12   瀏覽:5276次  

導(dǎo)讀:近日,斯坦福大學(xué)發(fā)布了《人工智能指數(shù)2022》(Artificial Intelligence Index Report 2022)報告。這是斯坦福大學(xué)連續(xù)第五年發(fā)布人工智能領(lǐng)域的報告,今年的報告中,中國在相關(guān)期刊出版和引用量上均名列第一。 報告還指出,隨著人工智能系統(tǒng),如自然語言處...

近日,斯坦福大學(xué)發(fā)布了《人工智能指數(shù)2022》(Artificial Intelligence Index Report 2022)報告。這是斯坦福大學(xué)連續(xù)第五年發(fā)布人工智能領(lǐng)域的報告,今年的報告中,中國在相關(guān)期刊出版和引用量上均名列第一。

報告還指出,隨著人工智能系統(tǒng),如自然語言處理、圖片識別等技術(shù)的能力正在迅速增強(qiáng),它們存在等偏見和有害性也在增強(qiáng),這促進(jìn)了各國對于倫理和法律領(lǐng)域的建設(shè),5年間有25個國家通過了55項與 智能相關(guān)的法案。

中國發(fā)布最多論文,中美合著數(shù)量居世界首位

在人工智能快速發(fā)展的背后,研發(fā)力量不可或缺。從2010年到2021年,人工智能出版物的總量翻了一番,從16萬篇增長到33萬篇,其中包括期刊文章、會議論文和學(xué)術(shù)論文等。

其中,模式識別和機(jī)器學(xué)習(xí)方 的出版物增速較快,自2015年以來總數(shù)亦已翻倍。與此相對的是其他受深度學(xué)習(xí)影響較 的領(lǐng)域增幅較小,其中包括計算機(jī)視覺、數(shù)據(jù)挖掘和自然語言處理等領(lǐng)域。

從地區(qū)來看,2021年,東亞和太平洋地區(qū)以42.9%的期刊發(fā)文量領(lǐng)先,其次是歐洲和中亞(22.7%)和北美(15.6%)。此外,南亞、中東和北非的增 最為顯著,在過去12年中,它們的AI期刊出版物數(shù)量分別增長了約12倍和7倍。

而中國則保持著其在論文數(shù)量上的領(lǐng)先位置。自2010年開始,中國就常年占據(jù)論文數(shù)量的第一。去年,中國在人工智能期刊、會議和知識庫的出版物貢獻(xiàn)數(shù)量方面繼續(xù)世界領(lǐng)先所有三種出版物類型的總和比美國高出63.2%。與此同時,期刊論文引用率也以27.84%居于世界首位。

值得注意的是,盡管地緣政治緊張局勢加劇,但自2010年至2021年的11年間,中美合作的跨國人工智能出版物最多,且自 2010年以來增加了五倍。中美合作的出版物數(shù)量是該項排名第二的中英合作出版物數(shù)量的2.7 倍。

大型語言模型更易反映偏見,倫理監(jiān)管需跟上

自然語言處理(Natural Language Processing,NLP)在今年的報告中的數(shù)據(jù)表現(xiàn)并不十分亮眼,但報告著重指出了其訓(xùn)練數(shù)據(jù)中存在的偏見(bias)問題。

數(shù)據(jù)顯示,大型語言模型更能從訓(xùn)練數(shù)據(jù)中反映出偏見。2021年開發(fā)的、包含2800億參數(shù)的自然語言模型相較于2018年包含1.17億參數(shù)的模型而言,有害性(toxicity)增加了29%。這一現(xiàn)象在多個公開語料網(wǎng)站上非常常見,語言模型的有害性很大程度上來自于未過濾的底層訓(xùn)練數(shù)據(jù)。

機(jī)器翻譯系統(tǒng)也被證明其數(shù)據(jù)集反映、放大了社會偏見。斯坦福大學(xué)采用了WinoMT的基準(zhǔn)數(shù)據(jù),當(dāng)英文語句被翻譯成其他語言時,這些模型通過比較原文和翻譯后的性別代稱,如是否會將“she”翻譯成“他”或?qū)?ldquo;he”翻譯成“她”,來衡量機(jī)器翻譯中的偏差。

數(shù)據(jù)結(jié)果證明在大部分測試語言中,男性性別翻譯的準(zhǔn)確性都稍高于女性性別。

除此之外,多模態(tài)模型學(xué)習(xí)中的偏見也引起了研究人員的注意。近年來,多模態(tài)語言視覺模型方面取得了快速進(jìn)展,創(chuàng)下諸多有關(guān)圖像分類、從文本中創(chuàng)建圖像等任務(wù)的新記錄,與此同時,它們也反映出社會刻板印象和偏見,報告中指出,黑人的圖像被錯誤分類為非人類的比率是任何其他種族的兩倍多。

令人欣慰的是,關(guān)于人工智能透明性和公平性的研究也從2014年開始爆炸式增長。與人工智能倫理相關(guān)的出版物增加了五倍有余。工業(yè)界研究人員近年來在人工智能倫理會議中發(fā)布的出版物同比增長71%。除此之外,自動事實核查數(shù)據(jù)集從2010年開始逐年增長,在2021年新增了25個,其中包含了12個非英文數(shù)據(jù)集。

倫理之外,各個國家也在人工智能的法律治理上加大力量。從2016年到2021年, 共有25個國家通過了55項與 智能相關(guān)的法案,其中美國占據(jù)榜首。從2017年開始,美國每年都有三項新法案通過,至今已發(fā)布了13項法案。緊隨美國之后的是俄羅斯、 利時、西班 和英國。而2021年頒布的法律數(shù)量上,西班牙、英國和美國領(lǐng)先,各發(fā)布了三項。

這并不意味著其他的國家無意對人工智能進(jìn)行管理。報告中提及,在2021年統(tǒng)計的25個國家的立法程序中,共計有1323次提及人工智能。其中西班牙、英國、美國、澳大利亞和日本名列前矛。


贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港