聽到一些對深度學習的負面評價,比如pearl 認為深度學習做社區做的不過是曲線擬合的工作而已,如何反駁這個觀點?


偏個題,從這個問題提到的Judea Pearl的觀點讓我想到,爭論這些觀點對錯的同時,也值得從這些學術巨人身上學習那種略顯「偏執」的精神。正是這種對自己學術觀點的堅持,才能讓他們寵辱不驚,堅持幾十年建築自己的學術思想大廈。

現在人工智慧的主流方法是深度學習,無論Judea Pearl還是Noam Chomsky的觀點,放在他們的學術思想中來看,都有其正確的一面。他們的學術堅持和不隨波逐流,決定了他們會對深度學習潮流持有的觀點。

Judea Pearl說:As much as I look into what』s being done with deep learning, I see they』re all stuck there on the level of associations. Curve fitting.

To Build Truly Intelligent Machines, Teach Them Cause and Effect | Quanta Magazine?

www.quantamagazine.org圖標

Noam Chomsky最近採訪說:(Deep learning is) not discovering the nature of the system at all because it does just as well, or even better on things that violate the structure of the system, and it goes on from there.

喬姆斯基專訪:深度學習並沒有探尋世界本質?

www.jiqizhixin.com圖標

深度學習現在是顯學,時間也不過10年而已。代表學者Geoffrey Hinton,Yann LeCun,Yoshua Bengio此前都坐了相當長時間的冷板凳。這從Yoshua Bengio的2003年的代表作Neural LM近十幾年的引用情況可見一斑。試想那段時間,他們如果沒有類似Judea Pearl和Noam Chomsky的堅持,估計中途就會改弦易轍。

能做到這點當然非常難,相當於做整個學術界主流的逆行者了,真的需要強大內心和「偏執」來支持。做學術研究,還真的需要一點這種「攻其一點、不及其餘」的精神勁兒。共勉。


深度學習在業界的成功應用是事實,不用有任何質疑。特別是在互聯網的現金牛,廣告、推薦、搜索領域的應用,對各業界巨頭業績的提升是毫無疑問的,極其顯著的。

因為理論基礎薄弱就放棄深度學習的應用,那你得問問各大巨頭的廣告部門願不願意自降5-10個點的利潤(保守估計),回歸到傳統機器學習上去,關鍵意義在哪呢?

其實這個問題的題目和描述簡直文不對題,極其歪曲Judea Pearl的本意。作為貝葉斯網路的奠基人,Pearl的本意一定是說深度學習網路沒有發現事物中蘊含的「因果」關係,沒有探尋到事物發展的本質。這當然是正確的,這是一個存粹的學術路線,學術方向的問題,和深度學習的應用沒有一點關係。

從這也可以再次體會到學界和業界的區別,業界的應用是充滿功利心的,不管怎樣的技術,不管有沒有理論支撐,只要能夠提升效果,你管他有沒有告訴你本質原因。

學界當然是不同的,Judea Pearl這個級別的科學家當然要以探尋事物發展的本質和擴展人類認知邊界為最高目標,要是都以業界應用為導向,那人類可以完全放棄數學、哲學和一切基礎科學的研究了。


如果想擡槓,認為「深度學習做的不過是曲線擬合」,無異於說計算機科學做的不過是加減乘除。

我覺得Judea Pearl的挫折感來自於AI現狀和AGI之間這個宏大的gap,相信這種無奈感在很多researcher裏都有。

比如Facebook最近release了Blender,一個號稱可以騙過人的chatbot。但是別人試了之後發現稍微不常見一點的對話,bot就會錯誤百出:

這讓人們又紛紛覺得即使Bert這樣的強大模型也並不理解語言,而只是做曲線擬合。但我覺得我們需要在human level的語言理解和random guess之間尋找個合適的邊界,是不是有個gold metric,60分了就算理解了語言,59分就不是理解?個人覺得這種metric是不存在的。語言理解是有許多層面的,比如做NLP的人都知道「中文屋子」的思想實驗,如果一個bot可以根據需求總是從language map到合適的行為,那它內部到底是曲線擬合或者別的什麼機制,有什麼關係呢?如果我們訓練一條狗,說「出門」它就知道要出門去玩了,它也只是學到了「出門」這個詞和出門這個動作的映射關係,它很可能並不知道這個詞是「出」和「門」的組合,更難generalize到「進門」、「門口」這些新的組合。個人覺得掌握這種映射關係比Bert的理解程度還低很多。現在Bert這樣的模型至少可以找到主謂賓,找到一個句子裏,哪些詞之間是互相修飾的關係,找到哪些詞是對特定任務重要的language cue,儘管由於過分依賴了這些cue而經常犯愚蠢的錯誤。

最後,我個人的觀點是,從最簡單的螞蟻、蜜蜂的智能到AGI,這是個連續光譜,儘管人在某些地方實現了breakthrough(比如符號處理能力),但在很多層面智能是個連續的東西,而現在的deep learning應該已經在某些方面可以達到或者超越一些低等動物的智能。AI社區的人沒必要因為沒達到AGI而妄自菲薄,也不需要那麼在意社區外的人對現有技術的嘲笑。


每一個青年人都不應該迷信權威:人非聖賢,孰能無過,要摒棄這種「因為他是知名教授/圖靈獎得主/某某之父,所以他說得對」的思維。

「All the impressive achievements of deep learning amount to just curve fitting.」這樣一句話,如果把他的身份背書拋開,你會同意嗎?深度學習的成就顯然不是用曲線擬合就可以概括的,深度學習擅長的問題從來就不是什麼「波士頓房價預測」,如果說深度學習的成就都歸結於曲線擬合,那我們豈不是也可以說,計算機在做的事情也只是01的多種運算?

類似之前有XX之父說「神經網路做的事情不過是記憶」,實際上這種對複雜系統的簡單總結解讀並不能對認清問題、解決問題起到多少積極作用。

當然這句話也不能脫離開語境來理解,Judea Pearl是很崇尚因果推理的,所以他反對深度學習方法也是很正常的,深度學習確實存在一些侷限,但這不代表它是一條走不通的路,至少按目前的效果來看,它還是一條很有前景的道路。:)

P.S. 在我看來,所謂的人工智慧本身就是依賴於應用場景的,拋開應用場景談智能就是耍流氓。是騾子是馬,要拉出來遛一遛才知道。

P.P.S. 關於智能,每個人的定義不一樣,從需求上來看,如果你希望讓AI減輕人類的工作負擔,那麼深度學習就大有可為;如果你希望AI能夠完全代替人類,那麼目前的深度學習顯然是有很多問題的。


當前腦科學研究理論基礎薄弱

是否意味著我們應該放棄用腦


推薦閱讀:
相關文章