本提問為「知乎 2018『互聯網洞見者』」十個提問的第四問,由國際人工智慧聯合會主席、香港科技大學楊強教授( 知乎 ID : 楊強 )提出。更多詳細信息,請點擊進入「互聯網洞見者」專題

知乎 2018「互聯網洞見者」?

event.zhihu.com圖標


首先說結論:機器智能和人類智能的最重要區別,在於我們尚不知道如何讓機器有效地生成和操作概念的表徵(representation of concepts),通俗地說就是,機器還沒有廣泛地把知識抽象化的能力。這啟示我們在培養後代的智力方面,要尤其注意培養其基於事實、歸納總結、提取本質、舉一反三、質疑求證的能力

楊強老師提出的問題非常深刻,也非常有前瞻性——對於人工智慧的研究者,釐清「機器智能與人類智能的重要區別」,並進一步探索消除這些區別的方法,可能會是深度學習之後人工智慧下一次革命的起點;而對於家長和教育工作者,理解人類智能相較於當前機器智能的核心優勢,也或許能夠讓我們抓住人類智力發展的重點,在子女的智力培養方面少走一些彎路。

我從大約十年前開始對人工智慧產生興趣,而思考人的智力培養的時間還要更久。後來從本科到博士,學習了從神經科學、認知科學到統計推斷、機器學習理論等等橫跨數個領域的十幾門課,也見證了人工智慧的前沿從概率圖模型變成神經網路的這個過程。對於這兩個問題,我有一些想法,算是按照自己目前的認識水平,對未來的預言吧。


機器智能和人類智能的最重要區別,在於我們尚不知道如何讓機器有效地生成和操作概念的表徵(representation of concepts),通俗地說就是,機器還沒有廣泛地把知識抽象化的能力

舉個例子,AlphaGo是當前最先進的人工智慧系統的一個代表了。它和它的繼承者AlphaGo Zero在圍棋問題上無人能敵,除了靠強大的計算機算力,也靠著積累了數百萬盤自我對弈經驗的大型神經網路的參數。這一系列中最強的AlphaGo Zero模型[1]的參數數量大約是五千萬。這樣大的信息量,顯然是無法作為人類知識傳授給棋手的。對比之下,人類獲取和傳播知識的方法就要高效得多。我們知道前人在幾千年的探索過程中,精鍊出一些圍棋的定式、經典的對弈,用於圍棋的教學研究。寥寥數言,卻往往深刻地總結了圍棋遊戲的本質規律。棋手若是能夠把相對少量的定式理解透徹、活學活用,就足以戰勝絕大多數業餘對手了。有趣的是,機器智能和人類智能也是有相似性的——除了自古流傳的定式,經驗豐富的頂尖棋手思考走子時也有極為準確的「直覺」,而這種「直覺」即是沒有經過符號化抽象的知識,很可能和AlphaGo的知識是類似的。

再舉一個例子,我國很多家庭重視孩童的文學啟蒙教育,其中一項內容就是教孩子熟背唐詩。諺雲:」熟讀唐詩三百首,不會吟詩也會吟。「這其實說的是一種類似機器智能的現象——訓練數據多了,就能找到一些統計上的規律。對於人類來說,這種找規律的過程是不需要意識主動參與的。類似的例子還有語言的學習,其中很重要的所謂」語感的培養「,也是一個基於大數據提取統計規律的過程。以上觀點的一個佐證就是,經過大量語料庫的訓練,現在的機器也可以培養出」詩意「和」語感「,比如會寫詩、會修改病句的神經網路。但人類智能的高明之處在於,我們超越了單一地從大數據中積累統計規律的學習方式。全中國有數幾億計的青少年學習英語,其中的絕大多數並非在雙語或純英語的環境裏生活,因此我們會在英語教學中講解語法和句法、音標和語調。學生掌握了這些提煉的規則,就能以較少的數據獲得類似的語言學習效果。更進一步來說,語言學的先驅們將複雜的人類語言現象歸納提取出普遍規則,才使得非語言環境中的語言學習成為可能,這可以稱得上人類智能的一個高光時刻了。


那麼,未來的機器智能有沒有可能也超越目前的大數據驅動的學習方式呢?我認為前景尚不明確,但希望還是有的。關於如何解決這個問題,人工智慧的不同研究流派之間有很大的分歧。人工智慧研究的符號主義流派堅持認為語義、概念要用符號來表徵,核心的研究問題是如何處理這些符號。這一流派實踐上的挑戰一是工程浩大難於規模化,二是不易與感知數據結合。從認知心理學出發的認知主義,包括在本問題裏解釋」通用人工智慧「(AGI)的答主,基於對人類學習過程的建模提出了一些認知模型。這一領域的挑戰是理論的可證偽性(falsifiability):任何智能的行為或心理活動,本質上都需要信息的處理,即演算法和它的物理實現,而它的效率和有效性也應該有數學以及實踐的支持。一些非常符合直覺的認知理論,或者有意無意忽略了對實現細節的討論,或者實現上會遇到嚴重的瓶頸。縱觀人工智慧的發展歷史,它其實是一門較為接近物理、化學或生物的經驗科學,甚至可能更接近化學和生物一些。正確的理論不會憑空而來,即使是相對論這樣石破天驚的理論,也是建立在」邁克耳孫-莫雷實驗「這樣強有力的實驗證據基礎之上的。因此,我認為那些沒有建立在實驗證據上、又無法由實踐檢驗的理論,也很難成為人工智慧發展的動力。

未來我們怎麼去填補機器智能相比人類智能的差距,目前來說,我最看好的仍然是由深度學習所代表的聯結主義。它認為包括概念和語義在內的知識,以及對這些概念和語義進行處理的知識,都應該由分散式的網狀連接來表徵;具體對應到目前的人工智慧實踐,就是表示為向量(矩陣、張量)或者由向量(矩陣、張量)參數化表示的函數。總結近幾年人工智慧在幾個應用領域的進展,共性是十分明顯的:

  1. 首先,由大數據集訓練得到的表徵,可以幫助提高小數據集上的表現。這啟發我們,未來的機器若要有效地生成和操作概念,可能也需要基於大數據獲得的表徵。
  2. 其次,更好的目標函數(和對應的模型設計)對學習更好的表徵可能起到至關重要的作用。生成對抗網路(GAN)、triple loss、cycle loss、self-supervised learning以及近期訓練語言模型BERT所使用的判別上下文的預訓練任務,都是這一原則的成功例子。這啟發我們,新的目標函數和配套模型設計,或許能為機器智能提取概念和語義提供新的可能性。
  3. 最後但也非常重要的,是設計適合於訓練(術語稱為優化)的模型,這可以從深度殘差網路(ResNet)的影響力窺見一斑。理解神經網路的優化,能夠避免許多設計和實現模型時容易犯的錯誤。在這一領域,我們的認識才剛剛起步,但隨著機器智能研究的進展,我相信未來它會成為一項人工智慧模型設計的基本功。

最後來回答楊強老師提出的第二個問題。既然目前機器智能和人類智能的最大區別在於把知識抽象化的能力,可以說這就是目前人類在智力方面的核心競爭力了。因此我們在培養後代的智力方面,也要尤其注意培養其基於事實、歸納總結、提取本質、舉一反三、質疑求證的能力。在具體操作上,一方面許多古今中外的科學家、發明家或者能人智者的事蹟,可以成為鼓勵其模仿的正面例子;另一方面,可以從生活中的簡單事例出發,循循善誘,引導其掌握由表象到本質的思考方式。

以上。

[1] http://discovery.ucl.ac.uk/10045895/1/agz_unformatted_nature.pdf


這個問題直接聯想到了之前馬雲爸爸的一段話,視頻如下。

馬雲 如是說

這裡做一些文字版的概括(引用),也加入一些對此的理解與看法:

在上個世紀,人們像機器一樣工作,而在未來,在今天,我們要讓機器像人一樣工作。但最終,機器就應該是機器,人還是人。

· 人們要有信心,我們人類有信念、有宗教、有價值觀,這些都是機器所沒有的。· 我不相信機器將取代人的工作,並且每一次技術革命,人類總共經歷過三次技術革命。第一次技術革命,扼殺掉了許多就業,但創造了更多的就業。第二次技術革命,也是殺掉了許多就業,創造了更多就業。我們將創造更多的就業,這是一定的。未來製造業不產生就業了,製造業將使用人工智慧、使用機器,因此,服務業將產生許多就業

機器的智能和人類的智能有2點重要區別:

1.機器智能最能取代人工智慧的是在需要較少智能的重複勞動領域和對科學精準度量要求高的行業,在與更多人類接觸的服務等行業,機器智能無法取代人類智能

2.機器智能沒有人類智能的「人性」

如果我們還是按照過去100年的辦法去教育孩子,他們就會有問題了,機器肯定要比人類聰明瞭,這是沒辦法的了,你沒法和機器比的,就好像你沒法和汽車比誰跑得更快,機器肯定會更聰明。

如果我們繼續教育孩子如何去背、如何做速算,他們以後肯定沒工作,因此,我們改怎麼教育孩子,應該換一種方式去教育。順便說一下,最終我們要孩子成功,就要讓他們學EQ、IQ和LQ,LQ是愛商

至於培養後代這一點,很受啟發。

在以前,包括現在,珠心算、速算等算數教育是會鍛煉後代的腦部開發,但是在未來的世界裡,完全可以由人類智能去操控機器智能來完成,原先的教育來幫助腦補的開發還是有必要的,但是要真正學會的是利用機器智能,使機器智能為人類智能服務,不再糾結於算數是否人工算對,而是是否快速、準確的知道如何用機器智能來獲取想要的精準結果。


短答案:關鍵區別是 機器的使命是解決一個問題,答案可以有無數個,只要做到最好、最快、最省就好;而大腦的使命是,在未出生之前,就用一個答案去面對無數未知的問題。這也是 生物與非生物 之間的最後界限。

啟示是 教育人類後代的過程中,關鍵不是在於 教會其完成一個已知的工作,而應是培養他們適應未來未知工作的能力。


下面展開來說。

先做個直觀的比較,直接上表格:

*備註:flops 是一個用來估算電腦效能的單位,指的是每秒所執行的浮點運算次數。megaflops =每秒一百萬次的浮點運算。

從硬體上來看 人類和機器之間 有兩個非常令人注意在意的區別:能耗 信息處理速度

第一,能耗。如果大腦的處理速度可以疊加,那隻需要四個燈泡的耗能,就達到超級計算機的處理速度。這是現在的人類科技想都沒法想的。

這一點,之前 @Summer Clover 的答案就很好了,在此不重複了(https://www.zhihu.com/question/49985162/answer/152099091)。

除此之外, @傅渥成 在這個答案(https://www.zhihu.com/question/49985162/answer/152123806)中還提到了另外的三點:

(1)人類似乎可以很好的解決小樣本的學習問題。

(2)從錯誤中學習和從別人的錯誤中學習。

(3)對複雜計算問題的直觀感受能力。

第二,信息處理速度。其實大腦的處理速度到底多少,這個數據是很不準確的,我這裡引用的是最常見的一個數據。大腦真實的信息處理速度應該比現在的估算更高。因為現在越來越多地發現,無論你在做什麼、注意力在哪兒,大腦也會一直自動地分析來自四面八方(各種感官)的信息。這些信息不僅不吸引注意力,甚至都不會到達你的意識。但大腦會自動將聲、光、溫度、觸感這些感知信息處理成我們一直習以為常的「真實世界」。這個感知過程發生地毫無痕跡、無知無覺、無時無刻。

如果要把這些創造「現實」的信息流也算進去,那肯定會超過22億 megaflops 這個數字。

之前針對這個問題,和劉看山一起做了個動畫視頻:「腦補」是如何產生的?| 好奇的北極狐;或是看之前的一篇專欄:大腦無時無刻不在「預測」世界

但,這麼比肯定是不公平的,畢竟我們不可能讓大腦都放在一個足球場一般大的房間裏,用 22億 megaflops 的速度做高速運算——地球上所有人一起計算都達不到這個速度。

那機器有哪些方面有絕對優勢呢?有三點。

  • 機器沒有那麼多決策偏見。相比於機器,人學什麼東西都挺快的,那是因為我們會觸類旁通,可以從過去學過的東西里吸取經驗,而不是從頭再來。但是這一過程中,過去學習到的東西,就很容易成為「偏見」。
  • 機器的執行速度快。在同等的準確率下,一個醫生的診斷大概需要幾分鐘,而機器在同樣的時間裡都做了上百萬次了。
  • 機器能夠無休止地運行。人也會無法抑制地感到疲憊、無法長時間注意力集中等等。而只要硬體沒問題,機器不可能無緣無故要求休息。

其實這三點都來源於大腦的同一個缺陷:它同時要做的事情太多了,而且我們對大腦並沒有完整的控制權。無論我現在在做什麼,無論是工作、遊戲還是睡覺,我的大腦大多數的能量其實都用在了其他任務上面,包括維持對身邊環境的警覺性。

在給病例做診斷的這個幾分鐘的任務中,如果突然發生了地震,人會立馬做出合理反應,背棄正在做的任務,立馬逃跑,但做疾病診斷的機器,卻不可能產生逃跑的念頭。


說到這裡,我們還沒有給智能下一個定義。

咱們形容一個事物有智能,無非是說它/他在面對一個或者多個問題時 能夠及時做出合理的反應,給出一個答案。所以,從本質上來講,智能就是面對問題給出答案。

而在這一點上,機器和大腦有根本性的區別:機器的使命是解決一個問題,答案可以有無數個,只要做到最好、最快、最省就好;而大腦的使命是,在未出生之前,就用一個答案去面對無數未知的問題。

這就是關鍵,也是 生物與非生物 之間的最後界限。

這對我們思考自己的人生,或是培養後代都有很重要的啟示。我們在培養機器的時候,就是以「如何完成一份已知的工作」為目標的,那是不是應該用同樣的目標來培養人呢?

相比於這個快速變化的世界,我們的大腦相當古老。這過去的幾萬年,我們的大腦就沒怎麼變過。那是什麼讓我們能夠勝任幾萬年前的人想都想不到的工作呢?

我在申請大學的時候 那是8,9年前了,看到一個數據讓我對選擇專業有了個新的認識。

我們這一代的工作崗位,百分之八十都是在我們讀書時候 父母和老師沒有想像不到的。同理,我們也無法預知下一代人會做怎樣的工作。

這讓我意識到 教育的本質 不應該是告訴一個人如何完成一份已知的工作,而是應該培養 TA 有能力去勝任 甚至創造出教育者本身都不知道是怎樣的一份工作。

那應該怎樣才能辦到這一點呢?

人天生總是會「想要」什麼,機器再能幹,也沒有「想要」。這「想」就是好奇心,「要」就是動機。

給 好奇心 提高權重。不只給做出正確答案的人以肯定,更應該激勵那些提出新問題的人。

通過激勵,激發人產生內在的驅動力,使之能夠自主地朝著目標前進。更重要的是,培養能夠維持追求這一單一目標的行為(堅持)還要維持心理上對這個目標的渴望(熱情)。

我想要喫上肉,但我拳頭不夠硬,那就找個石頭扔,誒,綁個繩子再扔,就不用擔心扔出去就找不到了。誒?先甩一下,扔出去會更有殺傷力誒。

我想要跑的更快,但人的肌肉就這樣了,那就發明輪子、發現燃料,創造車這一工具。

我想要舒舒服服地躺著也把錢掙了,那就發明不知疲倦、沒有自由意志、而且工作做得快又準的機器來幫我完成。

這就是人與機器的不同,這就是為什麼人與機器之間的關係並不是「先有雞還是先有蛋」那樣的關係,而是簡單明瞭的,肯定是先有人才有機。

最令人好奇的是好奇本身。人之所以為人,就是因為我們有好奇心。我們對火的好奇,讓我們喫上了熟食;我們對天空的好奇,讓我們在發明飛行器後僅用了半個世紀就登上了月球;我們對大腦的好奇,讓我們對千百年來的「靈魂」的理解有了更加靠近真相的機會。


最後,還是說回「智能」。在「智能」這個問題上,大腦是一個已知的高分答案。對於已有的AI技術,如果我們能在大腦中找到類似的結構、演算法,那麼便能夠認可這個技術在修建「通用人工智慧系統」(強AI)中的一席之位。

在離 強AI 的完成還有一定距離的當下,學界需要一個長期研究計劃,如何篩選研究方向則是一個複雜的問題。現在有很多演算法和結構,它們都有可能是強AI雛形的零件。

如果一個演算法,雖然它在現階段並不是最優的,但如果我們發現在大腦這個寸土寸金的地方它都有核心位置,那麼說明它至少本質上有適合強AI的地方(這麼說有點怪怪的),優先優化它、深入瞭解它,會是個減少繞彎路的策略。

當然,強AI並不一定需要擁有和生物體一樣的智能系統。條條大路通羅馬。但,大腦是一個很好的嚮導。


只說下視覺,這方面平時想的比較多。

動物的視覺系統和CNN有相似之處,但是差別也是巨大的。動物的視覺主要基於hebbian learning, 即如果兩個神經元同時激活,它們之間的突觸(權重)就會增強。hebbian learning加上競爭機制可以讓神經元學習輸入刺激中的重複模式,比如小朋友可以很快識別三角形、圓形、矩形等等,因為這些模式在生活中很高頻。而且小朋友喜歡看動畫片,因為動畫片色彩和圖案簡單,他們的視覺系統處理起來得到的中間表示比較簡單,也容易記住其中的新的模式。而神經元記住的中間模式則構成了類似CNN的層次性的特徵表示。所以人的視覺是從大致輪廓學起,慢慢掌握細微之處的。這種機制主體是無監督的,當然人有許多方式獲得弱監督或者強監督信號,所以人仍然可以有很好的物體分類能力。但人在細節分類方面仍然需要長年訓練纔行,比如沒經過訓練的人很難分清楚幾十種狗的區別,所以在imagenet上分類表現反而低於計算機。

但CNN的學習純粹是基於back propagation的,也就是把annotation裏很有限的信息從遙遠的高層想方設法傳到底層,除了這種機制完全沒有生物基礎外,可想而知傳下來的監督信息是非常碎片化的和不靠譜的。雖然CNN分類效果很好,但是卻遭受adversarial attack,說明CNN很多時候抓住的是一些細枝末節,卻忽略了整體輪廓(比如海龜上加了一點步槍上獨有的紋理,海龜就被識別為步槍)。但這種方法的好處是細節和大體結構「一鍋煮」,訓練者不需要關心怎麼兼顧二者,bp自動就在二者之間獲得了均衡,但副作用除了adversarial attack,也使CNN的中間表示很難visualize和interpret(儘管intuitively,越底層的語義信息越局部,越高層語義信息越是關於大物體的,但實際上visualize出來可能亂七八糟的)。

至於未來,顯而易見的一個發展方向是把動物視覺的無監督機制和CNN的bp結合起來。這樣既有人類視覺的「觀其大略」的強大泛化能力,也有了CNN那種強大的抓細節的能力,從而得到超人的視覺系統。


一個常見的誤解是人工智慧沒有創造力/感情,所以在人工智慧的時代人類應該專註藝術創造。這些論斷由於缺乏對名詞的精確定義,導致模糊不清雞同鴨講。

為了討論這個問題我們先要精確定義名詞。首先,這裡對「藝術」的討論侷限在繪畫,文學,音樂等傳統表現形式上。然後,我們將藝術創作的過程分為兩部分:「邏輯」和「表達」。

對於人工智慧來說,表達相對容易,難的是邏輯。

邏輯如何定義?我們來看兩個繪畫的例子(引自論文 https://arxiv.org/pdf/1711.08972.pdf):

這幾幅圖雖然很粗糙,5歲小孩就可以畫出來,但是包含了很多邏輯信息。比如鳥有兩條腿,腿長在身子上,鳥用腿站立,等等。這還只是單個物體的靜態情況,如果包含運動以及多個物體的交互,信息量會幾何爆炸。比如鳥可以飛,腿以腿根為軸運動,母鳥在給小鳥餵食……

這些模糊,涉及多個領域和大量常識,並且交互複雜的邏輯信息對於人工智慧來說非常難以理解。目前為止試圖建立「常識資料庫」的研究都不是很成功,多個常識之間的交互推理更是無從談起。

那麼表達是什麼?同樣來看兩個例子:

基於上面的「邏輯」圖,以及對於「鳥」的統計意義上的認知,畫出鳥的細節,就叫「表達」。表達對於人工智慧來說是一個容易的多的問題,近幾年研究進展很大,實際上上面的圖就是演算法自動生成的,我覺得已經比很多沒學過畫畫的人畫的好了。

類似的可以舉一個作文的例子:

昨天晚上胖虎把大雄揍了一頓,大雄跪地求饒。

這一句話裏包含了很多邏輯,比如胖虎比大雄壯,大雄被打很痛苦,弱小的大雄要向強大的胖虎示弱,等等。這些邏輯對於人工智慧來說同樣十分難以理解,如果再加上一段文章裏多句話之間的邏輯關係,就基本等價於目前不可企及的強人工智慧問題了。

但是如果給定上面一句話,讓人工智慧「潤色」成下面一句話,卻是相對簡單的:

在一個月黑風高的夜晚,胖虎使出一招黑虎掏心,將大雄擊倒在地,大雄以頭搶地連連求饒。

人工智慧經過基本的語法分析以後,可以基於統計信息總結修辭手法,然後進行替換和擴展,生成一句有「武俠」感的句子。實際上現在很多起點文作者都在用類似功能的寫作助手(當然比這個例子還要弱一點)。

總之,人類比人工智慧強在對模糊邏輯的理解和推理上,而不是藝術表達的技巧。隨著人工智慧輔助程序的發展,普通人和藝術家在表達手法上的差距會被縮小。然而藝術學習更多專註在表達手法的訓練上。尤其在打基礎時期,很多的時間都花在重複訓練上了,並沒有發揮人類智能的優勢。

順便說一句,「現代藝術」有很嚴重的淡化邏輯,強調錶達的傾向。我認為這是走歪了,或者說現代藝術在讓自己更容易被人工智慧替代的方向上一路狂奔。

比如前幾天一副人工智慧「創作」的畫在拍賣會上賣出了300萬的高價,而畢加索的畫在同一個拍賣會上只賣出了70萬。請大家欣賞人工智慧的大作:

很明顯這幅畫邏輯信息很少,只有一張模糊的臉和一塊大概是領子的空白。而這種模糊的表達方式很符合現代藝術的口味。

300萬成交!佳士得剛剛拍賣出首款AI畫作,同場碾壓畢加索?

mp.weixin.qq.com圖標
推薦閱讀:
查看原文 >>
相關文章