曹建峰 李惠茗編譯
12月3日,卡耐基國際和平基金會主席Mariano-Florentino Cuéllar、谷歌首席科學(xué)家Jeff Dean、知名計算機科學(xué)家David Patterson等人撰寫的長篇報告“Shaping AI’s Impact on Billions of Lives”發(fā)布,報告探討了利用人工智能增進大眾福祉的指導(dǎo)原則和行動路線圖。作者團隊與來自各個領(lǐng)域的24位專家進行了深入訪談,包括諾貝爾化學(xué)獎得主John Jumper、前美國總統(tǒng)Barack Obama、前聯(lián)合國大使兼前國家安全顧問Susan Rice、谷歌前首席執(zhí)行官兼慈善家Eric Schmidt以及科幻小說家Neal Stephenson等。本文是對該報告核心內(nèi)容的編譯。人工智能(AI)作為一種顛覆性技術(shù),既可能推動社會取得重大進步,也可能帶來負(fù)面影響。在讓AI自由發(fā)展和政府過度監(jiān)管這兩種極端之間,報告主張AI從業(yè)者應(yīng)自覺且積極地為公共福祉努力。通過與各領(lǐng)域的專家的廣泛交流,報告從中總結(jié)出五條指導(dǎo)原則,這些原則構(gòu)成了福祉型人工智能框架的基石,引領(lǐng)未來的研究方向,指導(dǎo)負(fù)責(zé)任和合乎道德地部署AI。報告描繪了一種新的創(chuàng)新模式藍(lán)圖,包括18個具體的里程碑,用以推動AI研究朝著福祉型人工智能的方向發(fā)展。報告認(rèn)為,當(dāng)前AI的發(fā)展仍處于初期階段,而從業(yè)者、政策制定者以及其他利益相關(guān)者的共同努力,能夠確保AI的發(fā)展最大限度地惠及社會,同時減少潛在的負(fù)面影響。
一、五個指導(dǎo)原則1、人機協(xié)作需聚焦人類生產(chǎn)力的提升而非取代人類
人類與人工智能攜手合作(即人機協(xié)作),能夠創(chuàng)造出比單打獨斗更大的價值。將人工智能應(yīng)用于提高人類生產(chǎn)力,而非取代人類,會帶來更多積極的好處。那些使人們工作效率更高的工具,不僅提高了人們的就業(yè)能力和職業(yè)滿意度,還為更多發(fā)展機會鋪平了道路。此外,當(dāng)AI在訓(xùn)練不足的領(lǐng)域偏離預(yù)期時,人類可以充當(dāng)重要的安全保障。因此,推動人類生產(chǎn)力的AI發(fā)展能夠?qū)崿F(xiàn)人機雙贏。
2、AI提升生產(chǎn)力需聚焦“彈性需求”行業(yè)以促進就業(yè)
要通過AI促進就業(yè),就需要聚焦那些因生產(chǎn)力提升而能夠創(chuàng)造更多就業(yè)機會的行業(yè)。以美國為例,盡管計算機和客運航空業(yè)取得了巨大的生產(chǎn)力提升,但2020年美國的程序員和商業(yè)航空駕駛員數(shù)量,分別是1970年的11倍和8倍。增長的原因在于,這些行業(yè)屬于經(jīng)濟學(xué)中的“彈性需求”(elastic demand)領(lǐng)域,即商品的需求量會隨著價格的下降而增加。而農(nóng)業(yè)等“非彈性需求”領(lǐng)域則因生產(chǎn)力提升而導(dǎo)致就業(yè)人數(shù)大幅減少,如農(nóng)業(yè)崗位從1940年到2020年減少了四分之三。如果AI開發(fā)者致力于在彈性行業(yè)中提升生產(chǎn)力,盡管公眾對此心存擔(dān)憂,但AI實際上可以創(chuàng)造出更多的工作機會。
3、AI優(yōu)先去除單調(diào)重復(fù)勞動,讓工作更有意義
AI的首要任務(wù)應(yīng)是減少現(xiàn)有工作中的枯燥重復(fù)部分,為人們騰出時間去從事更有價值的工作。例如,醫(yī)生與護士選擇這一職業(yè)是為了幫助患者,而非耗費時間在繁瑣的文檔工作上。同樣,教師更希望專注教學(xué),而不是花時間在評分或記錄工作上。因此,AI工具的研發(fā)應(yīng)優(yōu)先改善人們當(dāng)前工作中的意義感,尤其是在醫(yī)院和課堂等場景。
4、AI因地制宜推動發(fā)展
AI的影響因地而異。埃里克施密特(Eric Schmidt)強調(diào),在發(fā)達(dá)國家,人們擔(dān)心AI可能取代高度專業(yè)人才的部分工作;但在資源匱乏的地區(qū),AI則能夠填補技能專家的短缺,提升工作和生活質(zhì)量并促進經(jīng)濟發(fā)展。比如,AI可以提升護士與醫(yī)師的技能和生產(chǎn)力,為醫(yī)療資源匱乏的地區(qū)帶來高質(zhì)量醫(yī)療服務(wù)。同時,多語言AI模型能夠借助智能手機普及,為發(fā)展中國家提供信息、教育等資源支持,改善當(dāng)?shù)亟?jīng)濟和關(guān)鍵服務(wù),甚至可能為一些中等收入國家的人們提供移民之外的選擇。
5、構(gòu)建有效的測量和監(jiān)管體系評估AI創(chuàng)新
最后,我們需要更好的指標(biāo)和方法來評估人工智能創(chuàng)新。有時市場可以做到這一點,比如針對專業(yè)程序員的人工智能工具。但在高風(fēng)險領(lǐng)域,這是做不到的,因為我們不能冒險傷害參與者。我們需要使用黃金標(biāo)準(zhǔn)參考工具(gold-standard tools):A/B測試、隨機對照試驗和自然實驗等。同樣緊迫的是對人工智能在實際部署后的監(jiān)控,以評估其是否達(dá)到了預(yù)期目標(biāo),是否足夠安全,以及是否產(chǎn)生了意料之外的外部影響。此外,我們還需要在實際應(yīng)用中持續(xù)評估AI系統(tǒng)的表現(xiàn),以便逐步改進和優(yōu)化它們。
走向福祉型AI的十八個關(guān)鍵里程碑在長篇報告“Shaping AI's Impact on Billions of Lives”中,在五大原則的基礎(chǔ)上,十八個里程碑被提出,覆蓋就業(yè)、教育、醫(yī)療、信息傳播、媒體娛樂、政府治理、科學(xué)研究七大關(guān)鍵領(lǐng)域。需要推動人工智能在這些領(lǐng)域增進個人和社會的福祉。1、就業(yè)生產(chǎn)力提升對工作的影響取決于與該工作相關(guān)產(chǎn)品需求的彈性或非彈性,如果需求是非彈性的,生產(chǎn)率的提高將導(dǎo)致工作崗位的減少;如果產(chǎn)品需求具有足夠的彈性,那么提高生產(chǎn)力的技術(shù)將增加行業(yè)就業(yè)。關(guān)于就業(yè)的另一個視角是非體力任務(wù)和體力任務(wù)之間的劃分。短期內(nèi)人工智能系統(tǒng)的主要影響將集中在非體力任務(wù)上。因此,為了提升工作的質(zhì)量和價值,人工智能應(yīng)專注于賦能人類實現(xiàn)更多目標(biāo)。而且,利用人工智能提高人類生產(chǎn)力還可以應(yīng)對一些挑戰(zhàn),例如安全性或虛假信息在AI系統(tǒng)出錯時由人類糾正其建議,或在遇到AI系統(tǒng)未被訓(xùn)練的情況下由人類介入。(1)快速技能提升(Rapid Upskilling):通過AI幫助低收入或失業(yè)人群在短期內(nèi)掌握高需求技能,從而快速提升就業(yè)競爭力。(2)職業(yè)預(yù)測系統(tǒng)(Job Forecaster):通過實時追蹤勞動力市場變化,指導(dǎo)被AI取代的勞動力適應(yīng)新興的高薪職位。2、教育為了讓AI系統(tǒng)最終幫助大多數(shù)學(xué)生,AI系統(tǒng)就必須首先改善教師的工作,因為教師在很大程度上決定采用哪些技術(shù)。減少繁瑣工作的例子可能包括協(xié)助制定課程計劃、撰寫進度報告、布置作業(yè)以及評分等。要取得成功,這些解決方案必須以教師日常面臨的實際挑戰(zhàn)為驅(qū)動,并且必須與教師和學(xué)生的需求保持一致,而不是基于校董會或管理者的意見。(3)教師助手(Teacher’s Aide):減少教師日常繁瑣工作的負(fù)擔(dān),以提高教師的生活質(zhì)量和工作效率。(4)實證教育平臺(Empirical Education Platform):建立一個能夠進行RCT測試(隨機對照試驗)的教育平臺,理解每個學(xué)生的能力/資源及其同學(xué)、教師和學(xué)校的情況。(5)全球教師(Worldwide Tutor):利用智能手機的普及,為所有兒童提供符合他們語言、文化和最佳學(xué)習(xí)風(fēng)格的學(xué)習(xí)工具,幫助教師應(yīng)對不同水平的學(xué)生。3、醫(yī)療社會應(yīng)當(dāng)向每個人提供高質(zhì)量的醫(yī)療健康服務(wù),人工智能可以幫助實現(xiàn)這個目標(biāo)。目前醫(yī)療人工智能發(fā)展仍面臨一些挑戰(zhàn):其中一些挑戰(zhàn)涉及在現(xiàn)實世界中部署AI系統(tǒng)出現(xiàn)的研究難題,例如公平性、可用性、穩(wěn)健性和可解釋性等;另一個重要的障礙是基礎(chǔ)設(shè)施和法規(guī),很少有醫(yī)療系統(tǒng)具備輕松部署、更新和監(jiān)控算法的基礎(chǔ)設(shè)施,而嚴(yán)格的醫(yī)療法規(guī)使醫(yī)療系統(tǒng)更加謹(jǐn)慎。醫(yī)療人工智未來進展關(guān)鍵在于數(shù)據(jù)的可用性需要來自不同地點的大型、多樣化數(shù)據(jù)集,以確保模型在多種人群和條件下具有穩(wěn)健性和公平性。此外,還需要諸如聯(lián)邦學(xué)習(xí)等技術(shù),這種技術(shù)允許人工智能模型在多個獨立的數(shù)據(jù)池上進行訓(xùn)練,而無需共享或集中存儲任何原始數(shù)據(jù)。(6)醫(yī)療助手(Healthcare Aide):通過減少醫(yī)護人員的文書工作和單調(diào)乏味的任務(wù),降低醫(yī)護人員職業(yè)倦怠,幫助他們專注于患者護理。(7)專用醫(yī)療AI(Narrow Medical AI):專注于特定任務(wù),如預(yù)測ICU患者的病情惡化。(8)通用醫(yī)療AI(Broad Medical AI):通過整合多模態(tài)數(shù)據(jù),為醫(yī)療決策提供全面支持。4、信息/新聞/社交網(wǎng)絡(luò)隨著人工智能系統(tǒng)在與人類和其他AI系統(tǒng)的交互中變得更加自主,其可能帶來的潛在好處和誤導(dǎo)信息、虛假信息和偏見等風(fēng)險都在增加。人工智能系統(tǒng)是否能夠以符合用戶或社會利益的方式采取行動,變得更加重要。為了實現(xiàn)人工智能的潛力,我們必須建立方法,在最大化人工智能提供的信息優(yōu)勢的同時,減輕誤導(dǎo)信息、虛假信息和偏見的影響。盡管虛假信息對個人福祉和國際安全的威脅顯而易見,但部分誤導(dǎo)信息或偏見的威脅更加微妙:人工智能系統(tǒng)并不完美,而人們卻期望其作為一種智能工具是可靠的。為了解決與AI系統(tǒng)相關(guān)的誤導(dǎo)信息、虛假信息和偏見挑戰(zhàn),我們不僅需要高質(zhì)量的人工智能系統(tǒng),還需要有效的人類+人工智能(以及人工智能+人工智能)交互這是一個在監(jiān)管和研究中顯著缺乏關(guān)注的領(lǐng)域。我們必須開發(fā)方法,為用戶、開發(fā)者和監(jiān)管者提供對人工智能系統(tǒng)的控制和理解。這些方法將包括新型用戶界面,可以在顯示AI系統(tǒng)提供的回答或答案的同時提供有用的上下文信息,例如AI系統(tǒng)的置信度水平,或者回答或答案中包含的引用信息的來源。在人工智能工具鏈的更底層,這種理解需要能夠解釋人工智能模型內(nèi)部機制的技術(shù),以便了解:一個模型是否不適當(dāng)?shù)乜紤]了種族或性別而生成了有偏見的答案;是使用推理得出答案還是僅僅引用了模型記憶中的內(nèi)容;甚至可以區(qū)分模型是撒謊還是誠實,等等。(9)基于人工智能的公共討論平臺(AI-mediated Platform for Civic Discourse):旨在促進不同觀點之間的建設(shè)性對話,減少社會的兩極化。(10)虛假信息識別AI(Disinformation Detective Agency):檢測深度偽造內(nèi)容。(11)用于優(yōu)化信息獲取的可控AI(Controllable AI for Curating Information Consumption):防止信息繭房。5、媒體/娛樂與教育和醫(yī)療不同,許多娛樂領(lǐng)域的需求是非彈性的。如果人工智能提高了美術(shù)家和平面設(shè)計師的生產(chǎn)力,市場是否會擴大以容納更多的畫作和設(shè)計,這一點并不明顯。而如果我們將娛樂視為一個講故事的行業(yè),那么其中一個結(jié)果可能是人工智能系統(tǒng)能夠幫助更多的人講述更多的故事。(12)記者助手(A Journalist’s Aide):能夠快速檢查新聞草稿錯誤,并突出無法驗證的地方,顯示沖突來源。(13)版權(quán)檢測器/收益分享者(Copyright Detector/Revenue Sharer):當(dāng)檢測到版權(quán)作品被使用時,能夠相應(yīng)地分配資金給版權(quán)所有者,并獎勵開發(fā)可授權(quán)數(shù)據(jù)集用于訓(xùn)練AI的人。6、治理/國家安全/開源在監(jiān)管方面,現(xiàn)有法律已經(jīng)規(guī)范了許多人工智能應(yīng)用,挑戰(zhàn)在于如何針對新的人工智能使用案例解釋這些法律,這通常需要基于具體事實的判斷以及政策制定者對人工智能系統(tǒng)技術(shù)特性的更深入了解。另一個挑戰(zhàn)是通過精心制定的政策填補現(xiàn)有法律中的某些有限空白。這些政策需要考慮先進人工智能系統(tǒng)的獨特能力和優(yōu)勢,并采用能夠識別技術(shù)快速變化的應(yīng)對方式。關(guān)于是否將人工智能模型開源的爭論就是這一復(fù)雜方法的典型例子。盡管共享模型參數(shù)和技術(shù)細(xì)節(jié)可以促進創(chuàng)新,但也可能被惡意分子利用?傮w而言,今天的決策將塑造未來的人工智能格局,影響從經(jīng)濟競爭力到社會穩(wěn)定的一切。在實用人工智能的黎明時期,審慎的治理不僅是可取的,更是必不可少的。需要考慮以下七個原則:第一,平衡收益與風(fēng)險。單純關(guān)注風(fēng)險可能會阻礙有益成果和創(chuàng)新,但忽視人工智能帶來的益處與忽視風(fēng)險同樣是一個重大錯誤。第二,整體和透明的影響評估。對不斷發(fā)展的人工智能系統(tǒng)進行影響評估在幫助人們、組織和政府更好地了解人工智能系統(tǒng)的潛在貢獻及其風(fēng)險和局限性方面起著關(guān)鍵作用。由于人工智能系統(tǒng)的影響多種多樣,這些影響評估必須盡可能可靠,并廣泛公開以供個人和研究機構(gòu)使用,從而及時向政策制定者提出關(guān)切。第三,利用現(xiàn)有法律框架。與其完全制定新的監(jiān)管方案,不如盡可能調(diào)整并應(yīng)用現(xiàn)有規(guī)則。對人工智能日常應(yīng)用的治理更多地關(guān)乎對現(xiàn)有規(guī)則和標(biāo)準(zhǔn)的審慎適用,而不是制定全面的新方案來規(guī)范人工智能系統(tǒng)在所有情境下的使用。尤其需要確保人工智能系統(tǒng)至少達(dá)到與相同情境下人類決策者或非人工智能系統(tǒng)相同的法律標(biāo)準(zhǔn),以防止人工智能系統(tǒng)被用于規(guī)避責(zé)任。第四,彌補法律空白。即使我們可以依賴現(xiàn)有法律來應(yīng)對80%到90%的人工智能政策挑戰(zhàn),精心設(shè)計的新政策仍將幫助社會管理這項可能將某些形式的智能轉(zhuǎn)變?yōu)樯唐坊募夹g(shù)。第五,緩解偏見歧視。一方面,AI歧視已經(jīng)成為一個顯著問題,我們需要采取多種措施減少人工智能的偏見歧視。另一方面,不應(yīng)忽視人工智能模型提高公平性的潛力,因為人類決策現(xiàn)狀往往存在深刻缺陷,而人工智能模型可以作為幫助人類決策者檢測和減少人類偏見的有用工具。第六,投資公共利益和國家安全。一些有前景的政策更多地涉及投資和基礎(chǔ)設(shè)施,而非監(jiān)管。政策可以鼓勵尚未被市場充分接受或資助的人工智能應(yīng)用,或支持對國家安全至關(guān)重要的能力。第七,采用迭代政策制定。人工智能的快速發(fā)展和通用性要求對政策進行持續(xù)評估和完善。人工智能驅(qū)動的平臺可以同時促進政策評估以及公眾的咨詢和討論。(14)政府/行業(yè)合作的成功案例(Recent Government/Industry Collaborative Successes):展示全球范圍內(nèi)政府機構(gòu)與私營企業(yè)之間的成功合作,以增強AI的正面效應(yīng)并減少負(fù)面影響。(15)AI審計(Implementable AI Audits):建立明確的AI審計標(biāo)準(zhǔn),包括審計員的專業(yè)水平、具體測試項目及必須報告的信息。(16)改進公平性的AI(Equity-improving AI):人工智能公平性干預(yù)最具影響力的領(lǐng)域是治理中的應(yīng)用,在這一領(lǐng)域,人工智能可能被用于影響數(shù)十億人的決策,并產(chǎn)生重大的社會和經(jīng)濟影響。在這樣的情境中,這一里程碑將包括部署一個公平的人工智能決策支持系統(tǒng),或者使用人工智能進行分析,并輔以清晰的現(xiàn)實證據(jù),證明其在某些衡量標(biāo)準(zhǔn)上改善了公平性。7、科學(xué)人工智能發(fā)展給科學(xué)研究帶來了新的機遇,Google DeepMind甚至認(rèn)為人工智能將帶來科學(xué)發(fā)現(xiàn)的黃金年代。目前,在黑洞可視化、洪水預(yù)測、材料發(fā)現(xiàn)、天氣預(yù)測、縮減飛機尾跡、控制核聚變等離子體等方面已經(jīng)涌現(xiàn)了很多AI助力科學(xué)研究的例子?傮w而言,學(xué)術(shù)界和行業(yè)主導(dǎo)的研究中不斷增加的投資、興趣和應(yīng)用,推動了一場深度學(xué)習(xí)革命,正在改變科學(xué)發(fā)現(xiàn)的格局。(17)助力聯(lián)合國可持續(xù)發(fā)展目標(biāo)的AI科學(xué)突破(AI Scientific Breakthroughs for the UN Sustainable Development Goals):使用AI取得重要的科學(xué)突破,幫助實現(xiàn)一個或多個聯(lián)合國可持續(xù)發(fā)展目標(biāo)。(18)科學(xué)家AI助手/協(xié)作者(Scientist’s AI Aide/Collaborator):提升科研效率。十八個里程碑系統(tǒng)地回應(yīng)了當(dāng)前AI發(fā)展面臨的挑戰(zhàn),從技術(shù)優(yōu)化到社會責(zé)任均有所涉及。通過明確這些目標(biāo),AI不僅能夠推動就業(yè)增長、優(yōu)化教育與醫(yī)療資源,還能加速科學(xué)研究與信息傳播的進步,為全球公眾福祉帶來深遠(yuǎn)影響。
福祉型人工智能的激勵機制盡管AI存在數(shù)據(jù)隱私、知識產(chǎn)權(quán)、偏見等風(fēng)險,但其帶來的機遇同樣不容忽視。忽視其好處就像忽視其風(fēng)險一樣,都是錯誤的。政府需要加速跟上AI發(fā)展的步伐,建議通過公共和私營部門合作,打破官僚主義障礙,確保AI的安全性和透明性,并為政策制定者與公眾提供必要的教育。為了支持、促進人工智能為公眾福祉服務(wù),報告提出需要在兩個主要方向提供資金支持:一是設(shè)立激勵性獎項(Inducement Prizes),以激勵研究并認(rèn)可重要突破;二是資助為期三到五年的跨學(xué)科研究中心。
每個激勵獎金至少價值100萬美元,用于激勵推動AI積極影響的重要里程碑式研究,不同于表彰過去成就,激勵獎項給出了特定的目標(biāo)。上述提到的18個里程碑都應(yīng)配套相應(yīng)的激勵獎金。例如,AI相關(guān)的有2004年的DARPA自駕車挑戰(zhàn)賽、2009年的Netflix用戶評分預(yù)測算法獎。此外,Kaggle平臺上有300多項進行中的競賽。美國政府也支持了超過1300項激勵獎。對于研究不足的課題,報告建議資助為期三至五年的具有高影響力的跨學(xué)科研究中心。例如,20世紀(jì)70年代的UNIX項目以及2000年代的RADLab和Par Lab。除了開展實現(xiàn)里程碑的研究外,研究中心還需判斷什么樣的研究成果能夠獲得激勵獎金。研究中心與激勵獎協(xié)同作用,激勵獎金的參賽者為研究中心反饋研究過程中出現(xiàn)的關(guān)鍵挑戰(zhàn),以及轉(zhuǎn)讓技術(shù)成果。
總結(jié)
這或許是當(dāng)代人類的登月計劃,但我們的終點在哪?也許我們可以開發(fā)一個AI調(diào)解員,促進具有不同觀點的群體之間的對話,將社會從極化狀態(tài)引導(dǎo)回多元包容的方向。也許我們可以利用智能手機,為全球每個孩子開發(fā)一個定制化輔導(dǎo)軟件。又或許,我們可以讓AI成為生物學(xué)家和神經(jīng)科學(xué)家的得力助手,讓他們在十年內(nèi)取得相當(dāng)于一個世紀(jì)的研究進展。我們可以用AI干成很多事情,只要我們手握正確的創(chuàng)新藍(lán)圖,專家和用戶共同對話,我們就不必局限于單一目標(biāo),而是可以實現(xiàn)多個愿景。