當(dāng)前位置：人工智能實驗室> 人工智能動態(tài) > 2020 年，這些 AI 大事件讓我無法忘懷...

2020 年，這些 AI 大事件讓我無法忘懷...
來源：互聯(lián)網(wǎng) 發(fā)布日期：2021-01-10 17:41:41 瀏覽：19947次

導(dǎo)讀：作者：吳恩達轉(zhuǎn)自：AI科技評論日前，吳恩達在圣誕節(jié)之際回顧了2020年AI的一些重大事件，包括AI應(yīng)對新冠疫情、數(shù)據(jù)集存在種族偏見、對抗虛假信息算法、AlphaFold預(yù)測蛋白質(zhì)三維結(jié)構(gòu)、1750億參數(shù)的GPT-3出現(xiàn)等等，并為大家送上節(jié)日祝福。吳恩達寄語：親愛...

作者：吳恩達

轉(zhuǎn)自：AI科技評論

日前，吳恩達在圣誕節(jié)之際回顧了2020年AI的一些重大事件，包括AI應(yīng)對新冠疫情、數(shù)據(jù)集存在種族偏見、對抗虛假信息算法、AlphaFold預(yù)測蛋白質(zhì)三維結(jié)構(gòu)、1750億參數(shù)的GPT-3出現(xiàn)等等，并為大家送上節(jié)日祝福。

吳恩達寄語：

親愛的朋友們，在過去的十年中，每年我都會飛往新加坡或香港，與我的母親一起慶祝她的12月22日的生日。今年，我們則是通過Zoom線上慶生。盡管距離遙遠，但我仍然感到很高興，我的家人們可以從美國，新加坡，香港，香港和新西蘭一起線上聚會，并演唱同步性很差的“Happy Birthday To You”。

我希望我也可以和大家一起在Zoom上通話，以祝大家節(jié)日快樂，新年快樂！

節(jié)假日期間，我經(jīng)常想一想重要的人，回顧他們?yōu)槲一蛩怂龅氖拢⒛乇硎疚覍λ麄兊母兄x。這使我感到與他們的聯(lián)系更加緊密。

我覺得在我們遠離社交的假期中思考這一點非常有價值：誰是您生活中最重要的人，您可能出于什么原因要感謝他們？

無論是面對面的還是在線的，我都希望您能找到屬于自己的方式在這個假期里培養(yǎng)于最重要的人之間的關(guān)系。

Keep learning！

2020年回顧

在過去一年，一種新的具有高度傳染性的冠狀病毒破壞了人們的正常生活，它所導(dǎo)致的社會裂痕也威脅到了我們的共同利益。

在這一年期間，有大量的機器學(xué)習(xí)工程師參與其中，設(shè)計了用于新冠肺炎（Covid-19）診斷和治療的工具、建立了識別仇恨言論和虛假信息的模型，并指出和強調(diào)了整個AI社區(qū)偏見的存在。

但是事情也有輕松的一面：這一年里可以將睡衣一鍵轉(zhuǎn)換成西裝的在家辦公工具、GPT-3語言模型、在AI輔助藝術(shù)和表演方面的引人入勝的實驗。

接下來請就讓我們一起探討過去一年我們的艱辛和輝煌。

一、AI用于應(yīng)對新冠疫情

1、AI加快了科學(xué)家對冠狀病毒疫苗的搜尋，全球的機器學(xué)習(xí)研究人員爭先恐后地利用AI技術(shù)來對抗冠狀病毒。

2、巴黎和戛納市在公交車站、公共汽車和市場中使用計算機視覺評估了法規(guī)的遵守情況。

3、多哥政府訓(xùn)練一個模型以識別衛(wèi)星圖像中的貧困地區(qū)，然后使用模型的輸出指導(dǎo)將救濟金分配給最需要的人。

攝影：環(huán)球影業(yè)集團/阿拉米

4、聊天機器人提供了合成的虛擬朋友，供被疫情封鎖的人們孤獨時聊天和調(diào)情。

5、對于在家工作的人們，視頻會議公司訓(xùn)練AI模型來過濾背景噪音并將睡衣變成虛擬的商務(wù)正裝。

6、中國許多機構(gòu)合作開發(fā)了一種可在CT掃描中檢測Covid-19的模型，其準確度超過90％。該模型已在七個國家/地區(qū)部署，到目前為止，該模型的代碼已下載了超過300萬次。

7、美國生物技術(shù)公司Moderna，其疫苗于12月份獲得美國食品藥品監(jiān)督管理局的批準，它使用機器學(xué)習(xí)來優(yōu)化mRNA序列以轉(zhuǎn)化為可以測試的分子。

新聞背后：AI可能仍在治療Covid-19中起重要作用。某非營利組織使用了半監(jiān)督式深度學(xué)習(xí)平臺來篩選14,000種候選抗病毒藥物。該系統(tǒng)驗證了有望用于動物試驗的四種化合物。

8、在防范新冠疫情傳播中，口罩成為了絕對主力。為了讓大眾乖乖帶上口罩，人們可謂是操碎了心，AI也在這時候幫上了忙。

有人開發(fā)了一套AI系統(tǒng)，號稱能夠根據(jù)一個人說話的口音“聽”出是否佩戴口罩，且檢測的準確率已經(jīng)達到了78.8%。

研究人員開發(fā)這項技術(shù)的初衷是，他們發(fā)現(xiàn)，戴上口罩會影響語音的的效果，這是由于肌肉收縮、發(fā)聲量增加和傳輸損失引起的。

如今，戴口罩已經(jīng)成為了日常。為了適應(yīng)全民戴口罩的新環(huán)境，許多AI應(yīng)用也在對自身進行升級。一些企業(yè)就開發(fā)出了口罩檢測模型，可以判斷人群中的個體是否有戴口罩，甚至還開發(fā)了對戴口罩人臉進行身份識別的模型。

我的立場：人工智能不是萬能藥，但這種新型、高病毒性、高傳染性冠狀病毒的問世已經(jīng)成為人類利用AI對抗傳染病能力的有力試驗。

二、Deepfake偽造“一切”

當(dāng)生成對抗網(wǎng)絡(luò)滲透到文化、社會和科學(xué)領(lǐng)域時，它們正悄悄地在網(wǎng)絡(luò)中充斥著無數(shù)的合成圖像。

圖源：Techtalk

Deepfake出現(xiàn)在主流娛樂活動、商業(yè)廣告、政治活動中，甚至出現(xiàn)在紀錄片中，用來替換當(dāng)事人的真實面貌以提供隱私保護。在喧囂中，對圖像生成器的在線前端的狂潮基本上沒有引起人們的注意。

受到2019年的“ This Person Does Not Exist”（一個可以生成假的、逼真的個人肖像網(wǎng)絡(luò)應(yīng)用程序）的啟發(fā)，具有幽默感的工程師采用模仿現(xiàn)實世界細節(jié)的生成對抗網(wǎng)絡(luò)（GAN）。

例如：

1、經(jīng)過訓(xùn)練的Google Earth 可以使“This City Does Not Exist”產(chǎn)生大大小小的不存在的定居點的鳥瞰圖。

2、“This Horse Does Not Exist” 可以生成各種各樣的姿勢、品種和狀態(tài)的馬：

3、 “This Pizza Does Not Exist” 生成不存在的披薩，與真實的披薩相比，可能會缺少一些奶酪和醬汁的光澤感。

4、用AI生成的不存在的中國山水畫，欺騙了眾多藝術(shù)愛好者。

5、用AI生成不存在的雪人：

關(guān)于GAN的發(fā)展、應(yīng)用和風(fēng)險等問題，我曾經(jīng)對Ian Goodfellow進行了簡單的訪談。

Ian Goodfellow表示，他在GAN那篇論文中就列舉了很多未來可能的研究方向，但沒有想過域到域的轉(zhuǎn)換（domain-to-domain translation），比如CycleGAN。

關(guān)于GAN的用途，Ian Goodfellow認為，將GAN應(yīng)用在醫(yī)學(xué)領(lǐng)域會更有意義，比如為牙科患者設(shè)計個性化的牙冠，以及設(shè)計藥物等等。

最后，談到GAN輸出中包含的偏見，Ian Goodfellow表示：“隨著GAN生成人臉越來越逼真，GAN可以通過為其他機器學(xué)習(xí)算法生成訓(xùn)練數(shù)據(jù)，來抵消訓(xùn)練數(shù)據(jù)中的偏見。如果你使用的語言在數(shù)據(jù)中代表性不高，則可以對其進行過度采樣。但是，我希望還有其他方法可以解決數(shù)據(jù)集中代表性不足的問題。”

三、ImageNet等數(shù)據(jù)集存在種族偏見

深度學(xué)習(xí)的基本數(shù)據(jù)集開始受到廣泛關(guān)注。

由于數(shù)據(jù)集的編譯、標(biāo)記和使用方式的不同，導(dǎo)致其在模型訓(xùn)練過程中會對社會邊緣化群體產(chǎn)生偏見。研究人員的審查促進了AI的改革，同時也加深了人們對AI所隱含的社會偏見的認識。今年涉及的典型案例包括：

1、知名計算機視覺數(shù)據(jù)集ImageNet被推到了風(fēng)口浪尖。ImageNet的創(chuàng)建者李飛飛及其同事對數(shù)據(jù)集進行了重新梳理，并刪除了WordNet詞匯數(shù)據(jù)庫帶來的種族主義、性別歧視和其他貶義標(biāo)簽。

2、一項研究發(fā)現(xiàn)，即使使用未經(jīng)標(biāo)記的ImageNet數(shù)據(jù)進行訓(xùn)練，其模型也可能由于數(shù)據(jù)多樣性不足而引起偏差。

3、麻省理工學(xué)院計算機科學(xué)與人工智能實驗室撤回了Tiny Images數(shù)據(jù)集，原因是有外部研究人員發(fā)現(xiàn)該數(shù)據(jù)庫充斥著性暗示、種族歧視等大量不良標(biāo)簽。

4、用于訓(xùn)練StyleGAN的數(shù)據(jù)集FlickrFaces-HQ（FFHQ）同樣缺乏足夠的多樣性�；赟tyleGAN模型訓(xùn)練的PULSE算法將美國黑人總統(tǒng)巴拉克奧巴馬（Barack Obama）的肖像畫變成了白人。（PULSE可以將提高低分辨率照片轉(zhuǎn)化為高分辨率的圖像）

在PULSE事件爆發(fā)后，F(xiàn)acebook首席科學(xué)家Yann LeCun和當(dāng)時Google AI倫理負責(zé)人Timnit Gepu之間展開了一場辯論，爭論的焦點在于：機器學(xué)習(xí)中的社會偏見是出自AI數(shù)據(jù)集，還是AI模型？

LeCun的立場是：模型在訓(xùn)練“存在偏見的數(shù)據(jù)集”之前不存在偏見，也就是模型本身不存在偏見，而且有偏見的數(shù)據(jù)集是可以修改的。Gepu則表示：正如我們在信中所說的，這種偏見是在社會差異的背景下產(chǎn)生的，要消除AI系統(tǒng)的偏見，必須解決整個領(lǐng)域的差異。隨后，在關(guān)于偏見的進一步分歧中，Gepu和谷歌分道揚鑣。

Gepu對人臉識別技術(shù)進行過深入研究，并曾就科技行業(yè)缺乏多樣性發(fā)表過言論。此次Gepu被谷歌解雇事件的起因是Gepu想要發(fā)表一篇關(guān)于大型語言模型的社會危害的論文，但被谷歌內(nèi)部否決、要求撤稿，Gepu嘗試溝通無果，控訴谷歌不尊重邊緣群體的人權(quán)。

我的立場：確保數(shù)據(jù)集中的偏見在任務(wù)開始前被刪除，而這項重要的工作才剛剛開始。

四、虛假信息算法風(fēng)波

全球新冠疫情和有爭議的美國大選掀起了一場虛假信息風(fēng)暴，大型AI科技公司均受到了影響。

面對來自公眾日益增加的壓力阻止煽動性謊言，F(xiàn)acebook、Google的YouTube部門以及Twitter在爭相更新其推薦引擎。

據(jù)了解，紀錄片Netflix對他們進行了嚴厲的痛斥；美國國會議員對他們展開了調(diào)查；民意測驗顯示，他們已經(jīng)失去了大多數(shù)美國人的信任。

這幾家公司嘗試通過各種算法和策略解決虛假信息問題，例如：

1、在發(fā)現(xiàn)了數(shù)百個包含AI生成的虛假頭像的用戶個人資料后，F(xiàn)acebook嚴厲打擊了被認為有誤導(dǎo)性的操縱媒體，并徹底禁止了Deepfake視頻。該公司繼續(xù)開發(fā)深度學(xué)習(xí)工具，以檢測仇恨言論，導(dǎo)致偏見的模因以及有關(guān)Covid-19的錯誤信息。