機器之心報道
編輯:佳琪、陳陳
陶哲軒強調(diào)了在數(shù)學(xué)應(yīng)用和問題解決中需要找到合適的平衡點:既不過度簡化,也不過度復(fù)雜化,避免過度優(yōu)化和過度抽象導(dǎo)致的反效果。
剛剛,著名數(shù)學(xué)家陶哲軒在個人社交平臺更新的幾篇帖子,引起大家廣泛的共鳴。
陶哲軒用淺顯易懂的語言表達(dá)了自己對數(shù)學(xué)的理解與思考心得。
文中談到了一個關(guān)于「度」的問題,陶哲軒表示在設(shè)計系統(tǒng)時,缺乏或者過度的數(shù)學(xué)分析可能都會適得其反,所以要適度。
有時,我們不需要太過復(fù)雜精深的專業(yè)知識,大道至簡。
對于大多數(shù)任務(wù),使用一些相對簡單但通用的數(shù)學(xué)方法,往往比專門設(shè)計的算法效果更好。
陶哲軒還提到,在純數(shù)學(xué)中,故意忽略一些直覺上看似非常重要的信息非常有幫助。
接下來是陶哲軒帖子全部內(nèi)容。
掌握一點點的數(shù)學(xué)知識就能大有裨益。系統(tǒng)的設(shè)計不僅僅會因為缺乏足夠的數(shù)學(xué)分析而受到限制,同樣也可能因為過度的數(shù)學(xué)分析而受到阻礙。
一個常見的例子是網(wǎng)絡(luò)安全中對密碼的要求。從數(shù)學(xué)上講,密碼要求越復(fù)雜(例如,規(guī)定最小長度、特殊字符或不重復(fù)使用密碼),密碼就越安全。
然而,如果要求過于復(fù)雜,用戶和服務(wù)提供商可能會尋找繞過復(fù)雜要求的方法,比如尋找簡單的密碼重置或恢復(fù)方式,或者將密碼存儲在不安全的系統(tǒng)中。這些做法反而可能降低整體系統(tǒng)的安全性,而不是提升它。
另一方面,只對單一指標(biāo)(如用戶使用密碼直接登錄系統(tǒng))進(jìn)行過度優(yōu)化,可能會損害更廣泛的目標(biāo)。就如古德哈特定律(Goodhart's law)中所說的,「當(dāng)壓力施于其上以進(jìn)行控制時,任何觀測到的統(tǒng)計恒性都傾向消散!
粗略的講,在設(shè)計安全性時,直接輸入方式的安全性應(yīng)該加強到與其他輸入方式的安全性相當(dāng),但超過這個程度的加強反而可能適得其反。
舉個例子來說,如果一棟建筑的前門有鎖,但窗戶沒有防護(hù),那么再給前門加更多的鎖就沒有太大意義,這樣做甚至可能導(dǎo)致一種危險的虛假安全感。另一方面,如果窗戶比前門更難進(jìn)入,那么在前門上至少加一把鎖就很合理。
在人工智能領(lǐng)域,強化學(xué)習(xí)之父 Rick Sutton 的「苦澀的教訓(xùn)」(Bitter Lesson)就是這一原則的一個例子。
從直覺上來看,大家往往會認(rèn)為針對具體任務(wù)量身定制算法是最自然的選擇,在某些情況下,確實能取得不錯的效果。
其實,對于大多數(shù)任務(wù),使用一些相對簡單但通用的數(shù)學(xué)方法,如梯度下降和反向傳播,往往比專門設(shè)計的算法效果更好。通用方法不依賴于特定任務(wù)的領(lǐng)域知識,而是通過大量的數(shù)據(jù)和計算資源來訓(xùn)練模型,通常能帶來更大的進(jìn)展。
最近,我看到了有人為傳感器網(wǎng)絡(luò)開發(fā)更實惠的模數(shù)轉(zhuǎn)換器(ADC),就是這條發(fā)現(xiàn)的證明。
傳統(tǒng)上,ADC 電路基于經(jīng)典電氣工程原理設(shè)計,采用常微分方程(ODE)、共振、傅里葉變換等數(shù)學(xué)工具來構(gòu)建高效電路。然而,在一些特定環(huán)境(如傳感器網(wǎng)絡(luò))中,我們的目標(biāo)是大規(guī)模、快速且成本低的方式實現(xiàn)模數(shù)轉(zhuǎn)換,同時可以容忍一定的故障率。
在這種情況下,訓(xùn)練神經(jīng)網(wǎng)絡(luò)來設(shè)計 ADC 電路,不依賴任何專業(yè)領(lǐng)域的知識(如傅里葉分析),反而是更好的方法。
這并不是說領(lǐng)域知識毫無用處 例如,物理信息神經(jīng)網(wǎng)絡(luò)在許多物理領(lǐng)域的表現(xiàn)可以遠(yuǎn)超標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò) 關(guān)鍵在于了解在什么情況下,應(yīng)該運用多少領(lǐng)域知識。
在純數(shù)學(xué)中,一個有效的解題方法是故意忽略一些直覺上看似非常重要的信息。比如,在分析數(shù)論中,許多進(jìn)展都是通過把像素數(shù)這樣的「重要」數(shù)學(xué)對象轉(zhuǎn)化為看起來更加簡單、結(jié)構(gòu)較少的形式來實現(xiàn)的。這樣做可以讓我們更容易找到解決問題的途徑。
但抽象也需要把握一個度。如果抽象得過頭,就會丟失關(guān)鍵信息,反而無法解決問題;而如果抽象得恰到好處,問題就會變得更加清晰,從而找到合適的技巧去解決它。在此過程中甚至可以做出一些看似不太合理的變換,讓解題思路更加靈活起來。
我有時會開玩笑說,應(yīng)用數(shù)學(xué)家只需要掌握每本純數(shù)學(xué)研究生教材的前兩章,之后的章節(jié)對他們可能幫助不大(甚至可能有負(fù)面作用)。
另一方面,正是尋找第 3 到第 12 章的過程,才使得前兩章至臻完美、具有廣泛實用性的瑰寶。
在讀完陶哲軒的這段見解后,有人評論道:這些建議非常有價值,不論是對于哪種問題,都要做到:
簡化細(xì)節(jié),直到看到更宏觀的問題結(jié)構(gòu)。
判斷是否已有針對同類問題的解決方案。
或者判斷這個一般性問題類是否過于籠統(tǒng),或者是否過于具體。
參考鏈接:
https://mathstodon.xyz/@tao/113482950431855749