劉志毅/文在21世紀(jì)初,人工智能領(lǐng)域迎來了翻天覆地的變革深度學(xué)習(xí)的興起。它代表了一個(gè)時(shí)代的轉(zhuǎn)折,從傳統(tǒng)的機(jī)器學(xué)習(xí)方法走向了模擬人腦的高度復(fù)雜結(jié)構(gòu),實(shí)現(xiàn)了數(shù)據(jù)驅(qū)動的學(xué)習(xí)和決策過程。我們將從三個(gè)維度:技術(shù)背景、核心應(yīng)用與深度學(xué)習(xí)的現(xiàn)實(shí)與未來,來進(jìn)行全面的探討。
技術(shù)基礎(chǔ)
通用人工智能一直是學(xué)術(shù)界和產(chǎn)業(yè)界的追求目標(biāo)。在過去的幾十年里,這一目標(biāo)之所以逐漸變得觸手可及,得益于計(jì)算能力的飛速進(jìn)步、大數(shù)據(jù)的積累以及算法的不斷優(yōu)化。我們可以深入探討這三大支柱如何共同推進(jìn)AI領(lǐng)域的飛速發(fā)展。
首先是計(jì)算能力的躍進(jìn)。自從摩爾定律提出,我們就目睹了計(jì)算能力指數(shù)級的增長。這種增長不僅限于CPU的性能提升。近年來,GPU和TPU的出現(xiàn)為深度學(xué)習(xí)打開了新的大門。首先,它們具有并行處理能力,這使得深度學(xué)習(xí)模型的訓(xùn)練時(shí)間大大縮短。其次,高性能的計(jì)算硬件支持了更為復(fù)雜、更多層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。此外,硬件的優(yōu)化也促進(jìn)了新算法的創(chuàng)新,例如量子計(jì)算等,這些新算法再次放大了計(jì)算能力的增長。
其次,數(shù)據(jù)驅(qū)動的學(xué)習(xí)模式興起。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)已經(jīng)成為了AI的核心動力。首先,大量的數(shù)據(jù)為模型的訓(xùn)練提供了充足的“食物”,使得模型能夠更好地泛化到實(shí)際應(yīng)用中。經(jīng)濟(jì)學(xué)人曾指出,數(shù)據(jù)集如ImageNet不僅為計(jì)算機(jī)視覺帶來了革命,更重要的是它標(biāo)志著大規(guī)模數(shù)據(jù)集對于AI研究的重要性。此外,跨學(xué)科的合作也使得非傳統(tǒng)領(lǐng)域的數(shù)據(jù)開始被用于訓(xùn)練,如生物信息學(xué)和醫(yī)學(xué)影像等,進(jìn)一步加速了AI的應(yīng)用廣度。
第三,算法優(yōu)化帶來的深化與創(chuàng)新。盡管數(shù)據(jù)和計(jì)算能力為AI發(fā)展提供了基礎(chǔ),但真正的推動力還是算法的不斷創(chuàng)新。早期神經(jīng)網(wǎng)絡(luò)由于技術(shù)限制并不深,但近年來,技術(shù)如dropout、激活函數(shù)和不同的優(yōu)化器為深層神經(jīng)網(wǎng)絡(luò)的穩(wěn)定訓(xùn)練鋪平了道路。首先,這些技術(shù)解決了深層網(wǎng)絡(luò)容易出現(xiàn)的梯度消失和爆炸問題。其次,優(yōu)化器如Adam和RMSprop使得網(wǎng)絡(luò)在訓(xùn)練過程中能更快地收斂。彭博社在一篇文章中更是指出,算法的創(chuàng)新不僅限于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,更涉及到模型的結(jié)構(gòu)和組合,為各種任務(wù)提供了更加精確的解決方案。
核心應(yīng)用
人工智能研究的深入使我們進(jìn)入了一個(gè)偉大的時(shí)代,其中深度學(xué)習(xí)不僅代表了技術(shù)的進(jìn)步,更是對人類認(rèn)知的一次深刻挑戰(zhàn)。深度學(xué)習(xí)在各個(gè)領(lǐng)域中的重要應(yīng)用及其對未來的影響都將是巨大的。
首先可以看到的是,計(jì)算機(jī)視覺所面對的革命與影響。2013年的一項(xiàng)研究展示了深度卷積神經(jīng)網(wǎng)絡(luò)在Ima-geNet上的出色表現(xiàn),但這背后的意義遠(yuǎn)超過一個(gè)純粹的數(shù)值變化。首先,這一技術(shù)進(jìn)步標(biāo)志著機(jī)器已具備與人類相當(dāng)?shù)膱D像解讀能力。其次,這也為各種應(yīng)用,如無人機(jī)航拍、醫(yī)療影像診斷和實(shí)時(shí)監(jiān)控等,提供了堅(jiān)實(shí)的技術(shù)基石。最后,計(jì)算機(jī)視覺的進(jìn)步意味著大量重復(fù)性工作將被機(jī)器取代,從而釋放更多的人力資源去從事高附加值的任務(wù)。
其次,游戲與復(fù)雜決策的思考。AlphaGo的出現(xiàn)不僅是圍棋界的一次突破,它更是人工智能領(lǐng)域的一塊里程碑。首先,這一突破證明了深度學(xué)習(xí)能夠處理超出人類認(rèn)知范圍的復(fù)雜策略。其次,AlphaGo的技術(shù)也被廣泛應(yīng)用于其他領(lǐng)域,如金融投資和天氣預(yù)測等,進(jìn)一步提高了決策的精度和效率。最后,這種技術(shù)將助力于未來更為復(fù)雜的決策場景,例如城市規(guī)劃和國家治理。
第三,深度學(xué)習(xí)的現(xiàn)實(shí)與未來。無論是自動駕駛汽車還是智能助手,深度學(xué)習(xí)都正在發(fā)揮其不可或缺的作用。首先,其在各個(gè)產(chǎn)業(yè)中都成為了技術(shù)的核心,極大地推動了產(chǎn)業(yè)的發(fā)展。然而,盡管深度學(xué)習(xí)取得了顯著的成就,其工作原理和理論基礎(chǔ)仍不完善,這提示我們未來的研究還需深入。而當(dāng)AI系統(tǒng)開始展現(xiàn)更多的“智慧”時(shí),如何界定它們的角色以及如何與其共存,將成為一大倫理和哲學(xué)挑戰(zhàn)。
深度學(xué)習(xí)的進(jìn)步不僅代表了計(jì)算技術(shù)的飛躍,更是一次對人類自身的反思。它讓我們重新認(rèn)識到,人類的認(rèn)知、思考和創(chuàng)新能力,可以與機(jī)器相輔相成,共同開創(chuàng)一個(gè)更為寬廣的未來。
(本文作者系上海交通大學(xué)計(jì)算法學(xué)與人工智能倫理研究中心執(zhí)行主任、中國人工智能學(xué)會AI倫理工作委員會委員)