展會信息港展會大全

2020 年,這些 AI 大事件讓我無法忘懷...
來源:互聯(lián)網(wǎng)   發(fā)布日期:2021-01-10 17:41:41   瀏覽:19947次  

導(dǎo)讀:作者:吳恩達 轉(zhuǎn)自:AI科技評論 日前,吳恩達在圣誕節(jié)之際回顧了2020年AI的一些重大事件,包括AI應(yīng)對新冠疫情、數(shù)據(jù)集存在種族偏見、對抗虛假信息算法、AlphaFold預(yù)測蛋白質(zhì)三維結(jié)構(gòu)、1750億參數(shù)的GPT-3出現(xiàn)等等,并為大家送上節(jié)日祝福。 吳恩達寄語: 親愛...

作者:吳恩達

轉(zhuǎn)自:AI科技評論

日前,吳恩達在圣誕節(jié)之際回顧了2020年AI的一些重大事件,包括AI應(yīng)對新冠疫情、數(shù)據(jù)集存在種族偏見、對抗虛假信息算法、AlphaFold預(yù)測蛋白質(zhì)三維結(jié)構(gòu)、1750億參數(shù)的GPT-3出現(xiàn)等等,并為大家送上節(jié)日祝福。

吳恩達寄語:

親愛的朋友們,在過去的十年中,每年我都會飛往新加坡或香港,與我的母親一起慶祝她的12月22日的生日。今年,我們則是通過Zoom線上慶生。盡管距離遙遠,但我仍然感到很高興,我的家人們可以從美國,新加坡,香港,香港和新西蘭一起線上聚會,并演唱同步性很差的“Happy Birthday To You”。

我希望我也可以和大家一起在Zoom上通話,以祝大家節(jié)日快樂,新年快樂!

節(jié)假日期間,我經(jīng)常想一想重要的人,回顧他們?yōu)槲一蛩怂龅氖拢⒛乇硎疚覍λ麄兊母兄x。這使我感到與他們的聯(lián)系更加緊密。

我覺得在我們遠離社交的假期中思考這一點非常有價值:誰是您生活中最重要的人,您可能出于什么原因要感謝他們?

無論是面對面的還是在線的,我都希望您能找到屬于自己的方式在這個假期里培養(yǎng)于最重要的人之間的關(guān)系。

Keep learning!

1

2020年回顧

在過去一年,一種新的具有高度傳染性的冠狀病毒破壞了人們的正常生活,它所導(dǎo)致的社會裂痕也威脅到了我們的共同利益。

在這一年期間,有大量的機器學(xué)習(xí)工程師參與其中,設(shè)計了用于新冠肺炎(Covid-19)診斷和治療的工具、建立了識別仇恨言論和虛假信息的模型,并指出和強調(diào)了整個AI社區(qū)偏見的存在。

但是事情也有輕松的一面:這一年里可以將睡衣一鍵轉(zhuǎn)換成西裝的在家辦公工具、GPT-3語言模型、在AI輔助藝術(shù)和表演方面的引人入勝的實驗。

接下來請就讓我們一起探討過去一年我們的艱辛和輝煌。

一、AI用于應(yīng)對新冠疫情

1、AI加快了科學(xué)家對冠狀病毒疫苗的搜尋,全球的機器學(xué)習(xí)研究人員爭先恐后地利用AI技術(shù)來對抗冠狀病毒。

2、巴黎和戛納市在公交車站、公共汽車和市場中使用計算機視覺評估了法規(guī)的遵守情況。

3、多哥政府訓(xùn)練一個模型以識別衛(wèi)星圖像中的貧困地區(qū),然后使用模型的輸出指導(dǎo)將救濟金分配給最需要的人。

攝影:環(huán)球影業(yè)集團/阿拉米

4、聊天機器人提供了合成的虛擬朋友,供被疫情封鎖的人們孤獨時聊天和調(diào)情。

5、對于在家工作的人們,視頻會議公司訓(xùn)練AI模型來過濾背景噪音并將睡衣變成虛擬的商務(wù)正裝。

6、中國許多機構(gòu)合作開發(fā)了一種可在CT掃描中檢測Covid-19的模型,其準確度超過90%。該模型已在七個國家/地區(qū)部署,到目前為止,該模型的代碼已下載了超過300萬次。

7、美國生物技術(shù)公司Moderna,其疫苗于12月份獲得美國食品藥品監(jiān)督管理局的批準,它使用機器學(xué)習(xí)來優(yōu)化mRNA序列以轉(zhuǎn)化為可以測試的分子。

新聞背后:AI可能仍在治療Covid-19中起重要作用。某非營利組織使用了半監(jiān)督式深度學(xué)習(xí)平臺來篩選14,000種候選抗病毒藥物。該系統(tǒng)驗證了有望用于動物試驗的四種化合物。

8、在防范新冠疫情傳播中,口罩成為了絕對主力。為了讓大眾乖乖帶上口罩,人們可謂是操碎了心,AI也在這時候幫上了忙。

有人開發(fā)了一套AI系統(tǒng),號稱能夠根據(jù)一個人說話的口音“聽”出是否佩戴口罩,且檢測的準確率已經(jīng)達到了78.8%。

研究人員開發(fā)這項技術(shù)的初衷是,他們發(fā)現(xiàn),戴上口罩會影響語音的的效果,這是由于肌肉收縮、發(fā)聲量增加和傳輸損失引起的。

如今,戴口罩已經(jīng)成為了日常。為了適應(yīng)全民戴口罩的新環(huán)境,許多AI應(yīng)用也在對自身進行升級。一些企業(yè)就開發(fā)出了口罩檢測模型,可以判斷人群中的個體是否有戴口罩,甚至還開發(fā)了對戴口罩人臉進行身份識別的模型。

我的立場:人工智能不是萬能藥,但這種新型、高病毒性、高傳染性冠狀病毒的問世已經(jīng)成為人類利用AI對抗傳染病能力的有力試驗。

二、Deepfake偽造“一切”

當(dāng)生成對抗網(wǎng)絡(luò)滲透到文化、社會和科學(xué)領(lǐng)域時,它們正悄悄地在網(wǎng)絡(luò)中充斥著無數(shù)的合成圖像。

圖源:Techtalk

Deepfake出現(xiàn)在主流娛樂活動、商業(yè)廣告、政治活動中,甚至出現(xiàn)在紀錄片中,用來替換當(dāng)事人的真實面貌以提供隱私保護。在喧囂中,對圖像生成器的在線前端的狂潮基本上沒有引起人們的注意。

受到2019年的“ This Person Does Not Exist”(一個可以生成假的、逼真的個人肖像網(wǎng)絡(luò)應(yīng)用程序)的啟發(fā),具有幽默感的工程師采用模仿現(xiàn)實世界細節(jié)的生成對抗網(wǎng)絡(luò)(GAN)。

例如:

1、經(jīng)過訓(xùn)練的Google Earth 可以使“This City Does Not Exist”產(chǎn)生大大小小的不存在的定居點的鳥瞰圖。

2、“This Horse Does Not Exist” 可以生成各種各樣的姿勢、品種和狀態(tài)的馬:

3、 “This Pizza Does Not Exist” 生成不存在的披薩,與真實的披薩相比,可能會缺少一些奶酪和醬汁的光澤感。

4、用AI生成的不存在的中國山水畫,欺騙了眾多藝術(shù)愛好者。

5、用AI生成不存在的雪人:

關(guān)于GAN的發(fā)展、應(yīng)用和風(fēng)險等問題,我曾經(jīng)對Ian Goodfellow進行了簡單的訪談。

Ian Goodfellow表示,他在GAN那篇論文中就列舉了很多未來可能的研究方向,但沒有想過域到域的轉(zhuǎn)換(domain-to-domain translation),比如CycleGAN。

關(guān)于GAN的用途,Ian Goodfellow認為,將GAN應(yīng)用在醫(yī)學(xué)領(lǐng)域會更有意義,比如為牙科患者設(shè)計個性化的牙冠,以及設(shè)計藥物等等。

最后,談到GAN輸出中包含的偏見,Ian Goodfellow表示:“隨著GAN生成人臉越來越逼真,GAN可以通過為其他機器學(xué)習(xí)算法生成訓(xùn)練數(shù)據(jù),來抵消訓(xùn)練數(shù)據(jù)中的偏見。如果你使用的語言在數(shù)據(jù)中代表性不高,則可以對其進行過度采樣。但是,我希望還有其他方法可以解決數(shù)據(jù)集中代表性不足的問題。”

三、ImageNet等數(shù)據(jù)集存在種族偏見

深度學(xué)習(xí)的基本數(shù)據(jù)集開始受到廣泛關(guān)注。

由于數(shù)據(jù)集的編譯、標(biāo)記和使用方式的不同,導(dǎo)致其在模型訓(xùn)練過程中會對社會邊緣化群體產(chǎn)生偏見。研究人員的審查促進了AI的改革,同時也加深了人們對AI所隱含的社會偏見的認識。今年涉及的典型案例包括:

1、知名計算機視覺數(shù)據(jù)集ImageNet被推到了風(fēng)口浪尖。ImageNet的創(chuàng)建者李飛飛及其同事對數(shù)據(jù)集進行了重新梳理,并刪除了WordNet詞匯數(shù)據(jù)庫帶來的種族主義、性別歧視和其他貶義標(biāo)簽。

2、一項研究發(fā)現(xiàn),即使使用未經(jīng)標(biāo)記的ImageNet數(shù)據(jù)進行訓(xùn)練,其模型也可能由于數(shù)據(jù)多樣性不足而引起偏差。

3、麻省理工學(xué)院計算機科學(xué)與人工智能實驗室撤回了Tiny Images數(shù)據(jù)集,原因是有外部研究人員發(fā)現(xiàn)該數(shù)據(jù)庫充斥著性暗示、種族歧視等大量不良標(biāo)簽。

4、用于訓(xùn)練StyleGAN的數(shù)據(jù)集FlickrFaces-HQ(FFHQ)同樣缺乏足夠的多樣性;赟tyleGAN模型訓(xùn)練的PULSE算法將美國黑人總統(tǒng)巴拉克奧巴馬(Barack Obama)的肖像畫變成了白人。(PULSE可以將提高低分辨率照片轉(zhuǎn)化為高分辨率的圖像)

在PULSE事件爆發(fā)后,F(xiàn)acebook首席科學(xué)家Yann LeCun和當(dāng)時Google AI倫理負責(zé)人Timnit Gepu之間展開了一場辯論,爭論的焦點在于:機器學(xué)習(xí)中的社會偏見是出自AI數(shù)據(jù)集,還是AI模型?

LeCun的立場是:模型在訓(xùn)練“存在偏見的數(shù)據(jù)集”之前不存在偏見,也就是模型本身不存在偏見,而且有偏見的數(shù)據(jù)集是可以修改的。Gepu則表示:正如我們在信中所說的,這種偏見是在社會差異的背景下產(chǎn)生的,要消除AI系統(tǒng)的偏見,必須解決整個領(lǐng)域的差異。隨后,在關(guān)于偏見的進一步分歧中,Gepu和谷歌分道揚鑣。

Gepu對人臉識別技術(shù)進行過深入研究,并曾就科技行業(yè)缺乏多樣性發(fā)表過言論。此次Gepu被谷歌解雇事件的起因是Gepu想要發(fā)表一篇關(guān)于大型語言模型的社會危害的論文,但被谷歌內(nèi)部否決、要求撤稿,Gepu嘗試溝通無果,控訴谷歌不尊重邊緣群體的人權(quán)。

我的立場:確保數(shù)據(jù)集中的偏見在任務(wù)開始前被刪除,而這項重要的工作才剛剛開始。

四、虛假信息算法風(fēng)波

全球新冠疫情和有爭議的美國大選掀起了一場虛假信息風(fēng)暴,大型AI科技公司均受到了影響。

面對來自公眾日益增加的壓力阻止煽動性謊言,F(xiàn)acebook、Google的YouTube部門以及Twitter在爭相更新其推薦引擎。

據(jù)了解,紀錄片Netflix對他們進行了嚴厲的痛斥;美國國會議員對他們展開了調(diào)查;民意測驗顯示,他們已經(jīng)失去了大多數(shù)美國人的信任。

這幾家公司嘗試通過各種算法和策略解決虛假信息問題,例如:

1、在發(fā)現(xiàn)了數(shù)百個包含AI生成的虛假頭像的用戶個人資料后,F(xiàn)acebook嚴厲打擊了被認為有誤導(dǎo)性的操縱媒體,并徹底禁止了Deepfake視頻。該公司繼續(xù)開發(fā)深度學(xué)習(xí)工具,以檢測仇恨言論,導(dǎo)致偏見的模因以及有關(guān)Covid-19的錯誤信息。

2、YouTube開發(fā)了一個分類器來識別所謂的邊界內(nèi)容:包括仇恨言論、宣傳陰謀論、醫(yī)學(xué)錯誤信息以及其他想法的視頻。

3、Facebook和Twitter關(guān)閉了他們認為是擾亂國家宣傳活動的賬戶。


贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港