當前位置:首頁 > 軟件開發(fā) > 人工智能 > 正文
從人工智能到統(tǒng)計機器學習
作者:Carl 來源:LiveSpace 2007-09-09
今天一天收獲頗豐,我在微軟亞洲研究院訪問時的老板,機器學習領域的大牛,李航研究員來工大講學了,錯過了上次與其直接交流的機會(上次他來時,我恰好去韓國開會),這次可堅決不能放過。于是,一大早我就去了教室,結(jié)果還記錯了時間,早到了半小時,呵呵
不過我認為絕對不虛此行,大牛就是大牛,談古論今,旁征博引,整個上午的講座充滿了趣味性,將人工智能進行了系統(tǒng)的回顧和展望,并focus到統(tǒng)計機器學習,這個目前人工智能領域最熱門的話題上來。
他首先根據(jù)自己的經(jīng)驗,給AI一個工程化的定義,就是機器能夠類似于人的能力和行動,在給定輸入的條件下,輸出一個結(jié)果。最典型的例子就是Turing Test。因此說AI更偏向于工程,而非科學(數(shù)學化的自然)。
另外,他提到的Karl Popper"s的Refutability(反證不可能)哲學思想很有意思,大概意思是說,如果一個命題沒法證反,比如社會學,歷史學等,就沒有研究的意義了。此人在西方很出名,但是由于他批判馬克思主義反證不可能,所以被共產(chǎn)黨封殺也很正常了,呵呵
三種AI實現(xiàn)的方法:
1)Cognitive Science,通過自省的方法實現(xiàn)AI,這個基本上很難,因為人畢竟很渺小,大多數(shù)的東西,只知其然,不知其所以然,也就是說必要條件可知,但是充分條件很難知道了。
2)Physical Science,通過研究人腦的物理現(xiàn)象,如腦電流等實現(xiàn)AI,這就更困難了,就像我們?nèi)绻胍宄﨏PU的工作機理,只通過測量CPU的電流,電壓等參數(shù)一樣,基本不可實現(xiàn)。
3)Simulation方法,以目前人們的認識來看,就剩下這樣一種相對可能的方法了,說其相對可能,是因為和上面兩種方法比較起來,這種方法更容易實現(xiàn),效果也更好。但是模擬的方法很難抓住本質(zhì),因為多數(shù)事物都是橫看成嶺側(cè)成峰,只從一個片面的角度對其模擬,往往是一葉障目,不見泰山。
為什么說AI比較難呢?
1)Concept Hierachy很難獲得和定義。Wittgenstein"s "game"例子,也就是對于各種“game”,很難找到共性。
2)Inference過程難。人往往能夠進行快速,模糊的推理,而機器沒有這個能力。
3)智能也會受到Language的影響。Dani人對顏色的認識就三種,他們的智力和其他種族的會有差異。
4)人類Generalization的能力很強,可以舉一反三。
5)人類Discovery的能力很強。Hanson"s "Pattern of Discovery",講述了人類進行科學發(fā)現(xiàn)的時候,往往是心中有一種模式了,然后才來證明。聯(lián)想的自己的研究經(jīng)歷,確實也是這樣。比如做實驗,往往是證明自己方法的有效性,而不會去證明其無效。
說道AI的趨勢,大概有以下幾個(面向應用):
1)統(tǒng)計機器學習;
2)Data driven;
3)Task-oriented;
4)High Performance Computers
后半部分講的是統(tǒng)計機器學習,由于以前聽過,這里就不詳述,簡單說說其中的一些閃光點吧:
統(tǒng)計機器學習的三要素:
1)模型(Model):假設(Hypothesis)
2)策略(Strategy):損失函數(shù)優(yōu)化(Optimization of Loss function)
3)算法(Algorithm):尋找最優(yōu)模型(Finding optimal model)