利維坦按:本文較長,如果你是對人工智能以及人類大腦思考方式感興趣的人,請耐心看完,或許會對你有所幫助。

文/James Somers

原文/www.theatlantic.com/magazine/archive/2013/11/the-man-who-would-teach-machines-to-think/309529/

譯文原載於《新知》雜誌

圖源:GREG RUFFING

侯世達(Douglas Hofstadter)是《哥德爾、艾舍爾、巴赫——集異璧之大成》的作者,並以此書獲得普利策獎。他認爲我們已經忘記了“人工智能”真正的含義。

“這其實取決於你認爲人工智能指的是什麼。”侯世達在印第安納布魯明頓的雜貨店裏挑選沙拉配料。“如果有人認爲人工智能是指嘗試理解大腦思維,或者製造一些類似人類的東西,他們大概會說人工智能是有史以來唯一有價值的事情。”

侯世達的語氣裏帶有一種漫不經心的刻意,因爲對他而言,現代人工智能領域最激動人心的項目,那些彷彿是科幻小說裏纔會出現的產品——例如能夠參加益智競賽的IBM超級電腦沃森,或者iPhone語音助手Siri——其實和人工智能都沒什麼關係。在過去的三十年中,侯世達和他的學生都待在印第安納大學西北邊的一個老房子裏,試着補上這個研究缺口:通過編寫可以自己思考的程序來探索人類思考的方式。

他們的假設非常簡單:大腦是一個非同尋常的軟件,要明白這個軟件如何運行,最好的方法就是親自寫一遍。計算機非常靈活,足以模擬大腦奇怪複雜的思維,但它只聽命於精確的指示。如果他們的努力有所回報,簡直是一石二鳥:我們終於可以明白自己的思維機制——也可以製造懂得思考的機器了。

侯世達常說,這個改變了他人生的想法是在一次旅途中出現的。當時他是俄勒岡大學粒子物理專業的博士生,博士論文寫得非常不順利,感到“非常迷茫”,於是在1972年的夏天,他收拾行囊,鑽進了他那輛叫“銀色快手”的汽車,一路向東,橫穿北美大陸。

他每晚都在不同的地方搭帳篷,打着手電筒看書。他可以自由地思考他想思考的一切:他選擇了思考“思考”本身。14歲那年,他最小的妹妹茉莉“因爲大腦有嚴重障礙”,無法理解語言(她神經系統的這種狀況應該是從出生就存在的,但從未被確診過)。從那之後,他就默默着迷於大腦與事物之間的關係。心理學之父威廉姆·詹姆斯(William James)在1890年時曾將思考形容爲“世界上最神祕的事物”——意識怎麼會是有實體的呢?那幾磅重的灰質是如何決定我們的思維和自我的呢?

數學家、邏輯學家、哲學家哥德爾(1906-1978)。圖源:Encyclopedia Britannica

駕駛着他的1956年福特水星四處遊蕩時,侯世達覺得自己找到了答案——答案就在一個數學證明的核心裏。1931年,出生於奧地利的邏輯學家庫爾特·哥德爾(Kurt G?del)提出了一個著名的理論,論證了數學論述不僅可以研究數字,還可以研究這個論述本身。侯世達想說的是,意識也是通過類似的“交叉反饋環”所形成的。有一天下午,他坐了下來,在給朋友的信中寫下了自己的想法。但寫了三十頁紙之後,他決定先不寄信,而是讓這些想法在腦海中繼續醞釀。七年之後,這些想法發展成了一部2.9磅重,777頁厚的著作——《哥德爾、艾舍爾、巴赫——集異璧之大成》。這部處女作也爲三十五歲的侯世達贏得了1980年的普利策非虛構類作品獎。

圖源:Evolving Lens Bookseller

這本書又叫《GEB》,在當時引起了很大的轟動。《科學美國人》的知名專欄作家馬丁·加德納(Martin Gardner)在1979年7月刊中寫了一篇熱情洋溢的書評,“每隔幾十年,”加德納在文章的開頭如此寫道,“就會有一個名不見經傳的作者帶來一本深刻、清晰、豐富、機智、優美又獨特的書,立刻得到文學界的認可。”約翰·霍蘭德(John Holland)是第一位獲得計算機科學博士學位的美國人,他回憶說,“當時我周圍的人都認爲這是一部了不起的著作。”

《GEB》在當時被人工智能界奉爲聖經。侯世達認爲計算機程序不僅有能力解決問題,而且還可以很有創造力,他希望可以探索“人類大腦如電腦軟件般的祕密構造”,而他的解讀和藍圖也爲人工智能的研究吸引了整整一代充滿熱忱的學生。然而,就在人工智能的研究方向發生改變時,侯世達卻沒有跟着變,他幾乎消失了。

《GEB》的問世恰好趕上人工智能歷史的拐點。這門學科綜合了計算機科學、認知科學、神經系統科學和心理學等多個領域,但在上世紀八十年代初,它正面臨資助緊縮的問題:美國對於長期“基礎科學”的資金投入越來越少,重心都轉移到了更具實用價值的領域。人工智能因其“雄心勃勃”而名聲不好。回到1956年人工智能的起步時期,科學家們瞪大眼睛誇誇其談的情景很常見。當年的達特矛斯會議上,組織者們——包括髮明瞭“人工智能”這個詞的約翰·麥卡錫(John McCarthy)——宣佈說,如果一羣精心挑選出來的科學家共同努力一個夏天,就可以取得很大進展,製造出擁有以下一種或多種能力的機器:使用語言的能力;形成概念的能力;解決目前只能由人類解決的問題的能力;自我提升的能力。麥卡錫後來回憶起他們失敗的原因,說“人工智能比我們想象的要難”。

隨着冷戰時期的壓力日漸增加,人工智能研究的主要經費來源——國防部的高級研究計劃局(ARPA)——縮減了開支。1969年,國會通過了《曼斯菲爾德修正案》,要求國防部只能支持“與軍事運作有直接和明顯關係的”項目。到1972年,高級研究計劃局變成了國防部高級研究計劃局(DARPA),反映出對軍事相關項目的重視。到了七十年代中期,研究計劃局也在反省:我們在這十年間花了五千萬美元支持的研究對國防工作到底有什麼作用?

對於阿蘭·圖靈(Alan Turing)的著名問題——“機器可以思考嗎?”,人工智能學界一直試圖給出肯定的答案。到了八十年代初期,迫切想要交出一份答卷的人工智能研究終於開始成熟了——發展出了以應用爲主的軟件工程子領域。越來越多的研究都是爲了短期目標,研究人員在做研發的時候腦海中往往已經有了明確的買家。對軍方而言,最受歡迎的項目包括“命令和控制”系統,比如戰鬥機上的飛行導航,以及在航拍時能自動識別道路、橋樑、坦克和發射井等的程序。在民用領域,最受歡迎的是“專家系統”(編者注:一種在特定領域內具有專家水平解決問題能力的程序系統,能有效地運用專家多年積累的有效經驗和專業知識,通過模擬專家的思維過程,解決需要專家才能解決的問題),例如可以幫助設計師選擇打地基的材料的“樁柱選擇系統”,還有ACE專家系統(Automated Cable Expertise),可以對電話電報網絡故障進行檢修並推薦適當的策略。

《GEB》一書中,侯世達呼籲人工智能研究不要執着於如何讓機器聰明地解決人類的問題,而應更多關注對人類思想的理解——這顯然帶不來什麼收益,所以就被拋棄了。他的明星光環也很快消失了。當時的主流迎來了新的目標:讓機器可以完成各種各樣的工作,而罔顧精神和心理上是否合理。

圖源:Public Radio International

以IBM的超級計算機深藍爲例,它雖然擊敗了國際象棋大師加里·卡斯帕羅夫(Garry Kasparov),卻是以蠻力取勝。每走一步之前,它都會先考慮對手下一步會怎麼走,再決定如何應對,至少考慮到六步以上。因爲計算功能極爲強大(深藍在一秒內可以計算出3.3億種走法的得分,而卡斯帕羅夫在下決定之前只能算出其中幾十種),它能在極短時間內計算和評估每一種走法的得分,然後按最高分的那種走法走就行了。

侯世達想問的是:爲什麼要做毫無勝算的事?他說,“深藍下棋很厲害——又怎樣呢?你能從中瞭解我們自己是怎麼下棋的嗎?你能從中知道卡斯帕羅夫是如何謀劃和理解棋局的嗎?”人工智能的任何一個分支領域如果不嘗試去回答這樣的問題——無論看起來成就有多大——在他看來都是走入了誤區。“對於我這樣一個剛剛起步的人工智能研究者而言,”他說,“顯然應該遠離這種旁門左道。人們會把一些看起來很厲害的程序當作人工智能,但我知道它們和智能一點關係都沒有,我完全不想和這種研究扯上關係。而且我也不理解爲什麼那麼多人不這麼想。

人工智能產業在八十年代初價值區區數百萬美元,到了八十年代末已經漲到了數十億美元,或許這能夠回答侯世達的困惑。(1997年深藍獲勝之後,IBM的市值上漲了一百八十億美元。)人工智能作爲一個工程學科越是古板,取得的成就卻越大。今天,技術正處於黃金時代,卻與思想幾乎無關。人工智能滲入重工業、交通和金融等多個領域。許多Google的核心功能都是由人工智能驅動的,還有Netflix的電影推薦,IBM的沃森人工智能系統,蘋果的人工智能助理Siri,無人機以及自動駕駛汽車等。

“當萊特兄弟和其他人停止模仿鳥類,開始學習空氣動力學時,就是人類飛天夢實現的開端。”斯圖亞特·羅素(Stuart Russell)和彼得·諾維格(Peter Norvig)在他們所著的教材《人工智能——一種現代的方法》中是這麼寫的。人工智能也是在放棄了模仿人類之後才漸入佳境的。既然飛機不需要扇翅膀,計算機爲什麼要學會思考?

這個觀點很有力。但你得仔細想想我們真正想要的是什麼:一個能明白你在搜索時到底想搜什麼的Google。羅素是伯克利大學的計算機科學教授,他對我說,“網上所有搜索引擎公司的市值加起來有多少?大概四五千億美元吧。而可以真正提取並理解所有搜索信息的搜索引擎的價值可以達到這個數字的十倍。”

圖源:Gifer

這就是那個價值億萬美元的問題:目前支撐人工智能領域的研究方向——不模仿大腦,而是以大數據和編程爲基礎——可以帶我們到理想的彼岸嗎?如果連自己是如何思考的都不知道,你要如何製造一個能夠理解你的搜索引擎?或許,正如羅素和諾維格在他們教科書的最後一章中非常委婉地承認的,人工智能就像是一個想通過爬樹爬到月亮上的人,“在爬到樹頂之前一路上確實取得了穩步進展。”

計算機至今還無法識別一個手寫的A。事實上,這個任務對計算機來說太難了,所以纔會有CAPTCHAs(全自動區分計算機和人類的圖靈測試),也就是所謂的“驗證碼”,很多網站在註冊之前經常要求你輸入一串扭曲變形的字符。

在侯世達看來,這沒什麼值得驚訝的。他在1982年的論文中曾經論證,要想知道所有的A有什麼共同特點,“需要理解思維範疇的流動本質。”而這,就是人類智慧的核心。

“認知就是識別,”他喜歡這麼說。他認爲“看作”(see as)是最關鍵的認知行爲:你會把幾條線看作“A”,把一塊木頭看作“一張桌子”,把一個會議看作“皇帝的新衣”般的場景,把朋友的撅嘴看作是“酸葡萄”心理的表現,把一個年輕人的穿衣風格看作“新潮”……這就是所謂的理解。理解到底是怎麼運作的呢?三十年來,侯世達和他的學生一直試圖尋找答案,建立一個“思維基礎機制的電腦模型”。

《表象與本質》原版書封。圖源:Amazon.com

“每時每刻,”侯世達在新書《表象與本質》(與Emmanuel Sander合著)中寫道,“我們都面臨數不清的複雜交錯的情形。”我們作爲有機體想要生存下去的話,就必須時刻在這混亂中尋求秩序。侯世達很愛運用類比。他的新書封面是一系列不同字體的A,該書的主旨大意就是,“類比”是“思考的燃料和火焰”,也是日常精神生活中的麪包和黃油。

“研究一下你們的談話內容,”他說。“反覆琢磨幾遍,你會驚訝地發現,談話就是製造類比的過程。”有人說了什麼,讓你想起了別的什麼;你說了什麼,讓別人想起了其他什麼——這就是對話,再直接不過,但類比的思維跳躍如此複雜,簡直是一種計算的奇蹟:你的大腦就是有辦法透過不相關的表面信息直擊要害,提取核心,然後從你的想法和經歷的資料庫中找到最相關的一個故事或者一句話來進行迴應。他寫道,“哦,沒錯,我也遇到過這樣的事!”,這樣的話背後就隱藏着人腦的全部奧祕。

《GEB》出版之後,侯世達就與人工智能分道揚鑣了。今天,若你從書架上抽出《人工智能:一種現代的方法》,翻遍這本超過一千頁的書,你也找不到侯世達的名字。同事們提及他的時候用的是過去時。新的粉絲翻到《GEB》的出版日期,發現作者居然還活着會覺得很驚訝。

按照侯世達的說法,當人工智能領域的所有人都在製造產品時,他和他的團隊卻在對核心問題進行抽絲剝繭的分析。他的哲學家朋友丹尼爾·丹尼特(Daniel Dennett)寫道,“他們的分析很有耐心,很系統,很精彩”。“很少有人對人腦智能如何運作感興趣,”侯世達說,“這正是我們感興趣的——什麼是思考?——我們一直都在探索這個問題的答案。”

“我的意思是,誰知道呢?”他說。“或許將來有人會說,這些事情侯世達早就說過,早就做過,只是我們現在才意識到。”

聽起來很像是輸家的自我寬慰。但面對這樣一個人,你會忍不住想問一句:如果人工智能界最好的想法——侯世達所謂“真正的人工智能”——被丟棄在布魯明頓的一個抽屜裏泛黃,一切又將如何呢?

圖源:Rod Searcey

侯世達的一生從一開始就註定與思考爲伴。他成長於上世紀五十年代的斯坦福校園,旁邊的社區就叫“教授屯”。父親羅伯特(Robert)是核物理學家,是1961年諾貝爾物理學獎的獲得者,母親南希熱衷於政治,是發育性殘疾兒童的權益倡導者,同時也是阿格紐發展中心的道德委員會委員;妹妹茉莉在阿格紐發展中心生活了超過二十年。

南希長於社交,侯世達一家的客廳被改造成了知識精英們盡情談天和跳舞的地方。知識的盛宴夜夜不斷,小侯世達則盡情饕餮。他被父母朋友口中那些“最小的東西和最大的東西”給迷住了。(八歲的時候,他曾說,他的夢想是成爲“一個零質量的中微子”。)他會在四點下午茶的時間去物理系閒逛。“就好像我是一個12歲的本科生一樣。”他好奇心很重,學而不厭,也從來不覺得無聊——“是一個熱愛思考的孩子”——而且他的學習強度非常大。不論過去還是現在,他總是縱情在知識中狂歡:他可以一天練習鋼琴長達七個小時,他會突然決定背誦1200行的《葉普根尼·奧涅金》;他曾花好幾周的時間用一臺錄音機教自己倒着講話,這樣錄音倒播的時候就可以聽到正常的英語;他會花好幾個月浸泡在法語裏,或者編寫電腦程序來生成無意義的故事;他還會翻來覆去研究畢達哥拉斯定理的十幾種證法……他每天都在探索這些事情,“沒辦法不去探索。腦海完全被這些想法佔據了,完全着迷了”。

侯世達今年68歲,但身上還是帶有一種彼得·潘式的純真。他的一生大部分是在紙上、程序裏還有自己的腦海中度過的。這樣的人,即使老了大概也是與衆不同的。他的灰髮在後隨意亂翹,看起來虛弱又無精打采,鼻子和上脣之間有一道長長的人中,就像聖誕怪傑一樣。他的自矜和急切的熱誠又是年輕人式的。他是那種會讓所有晚宴客人都吃素食的素食主義者,也會敏感地糾正你的“性別主義用詞”。“他的規矩很多,”與他相識59年的朋友彼得·瓊斯(Peter Jones)解釋說,“比如他特別討厭有人說夥計們(you guys)。如果你要跟他說話,最好別用這個詞。”

三十多年來,侯世達都在布魯明頓的印第安納大學當教授。去年九月他又結婚了,與妻子林寶芬(Baofen Lin)一起住在距離校園幾個街區的一棟房子裏。他與上一任妻子所生的兩個孩子丹尼(Danny)和莫妮卡 (Monica)都已長大成人。儘管他和認知科學項目以及好幾個系所都有緊密的聯繫——包括計算機科學、心理學和大腦科學、比較文學以及哲學——卻沒有正式的責任義務。“我認爲我的工作是你能想象到最輕鬆的工作,”他告訴我,“我想做什麼就做什麼。”

他的大部分時間都消磨在書房裏。書房是他房子頂層的兩個房間,鋪了地毯,有點擠,有點亂。很顯然,他的整個精神生活就在這間書房裏——整面牆都是書本、畫作、筆記本和檔案,他的思想像化石一樣沉澱了下來,鋪滿了整個房間,很像是紀錄片《強迫性囤積症患者》中的場景。在這裏,他閱讀,聽音樂,學習,繪畫,寫書,回郵件(侯世達每天要花四個小時寫郵件)。“對我而言,”他說,“寫郵件和寫信是一樣的,一樣正式,樣精煉,一樣認真……所有的郵件我都會不停地重寫、重寫、再重寫。”

我思考的任何事情都會變成我專業的一部分,”他說。與他合著《心我論》的丹尼爾·丹尼特解釋說,“簡單來說,侯世達是一位現象學家,工作中的現象學家,而且是史上最好的現象學家。”他會研究自己大腦內的現象——感覺和內在活動。丹尼特告訴我,“他比其他人都要在行的原因是他非常積極地想要提煉出一個理論,總結思維的形成方式。”

侯世達的後口袋裏永遠放着一根四色圓珠筆和一個小筆記本。他的書房旁邊原本有一個浴室,現在也成了儲物間,裏面好幾個書架上都堆滿了這樣的筆記本。他抽出了一本——五十年代末期時用過的一本。裏面滿滿都是口誤記錄(speech error)。從少年時代至今,他已經發現了大約一萬個口誤案例,包括髮音置換,比如將hypodermic needle(皮下注射的針)發成hypodeemic nerdle;還有荒唐的近音錯誤,比如把runs the gambit(經營策略)發成runs the gamut(全部展示);以及“諺語雜糅”,比如easy-go-lucky就是happy-go-lucky(無憂無慮)和easy-going(性情隨和)的雜糅,諸如此類。裏面一半以上的口誤都是侯世達自己犯下的。他把筆記本里面的紙複印下來,剪好,保存在書房的檔案櫃或貼了標籤的盒子裏。

對侯世達而言,這些都是線索。“對於自己的下意識思維,誰說的話都不可靠,”他曾經這麼寫道,“所以廣泛收集錯誤就非常重要。若只看一個錯誤,只能發現思維機制的一點規律;如果收集了大量錯誤,海量的規律加起來就可以讓我們得到一個強大的證據,證明或者否定某種機制。”正確的語法沒什麼意思,它就像一個表演成功的魔術——效果很好,因爲它模糊了人們的焦點,讓人們看不到其中的奧祕。侯世達在尋找的是“兔耳朵和活板門的一角”。

美國哲學家、心理學家威廉姆·詹姆斯。圖源:The Conversation

在這方面,他可謂是現代的威廉姆·詹姆斯。詹姆斯在1890年出版了《心理學原理》,以清晰的內省(他引入了意識流的概念)和利落的解釋而被奉爲經典。“我們的思考大部分都會永遠消失,再也找不回來,”詹姆斯是這麼寫的,“心理學僅僅是把餐桌上掉下來的碎屑收集了起來。”就像侯世達,詹姆斯也樂於在餐桌下玩耍,愉快地檢查着那些碎屑,並以此爲生。差別就在於詹姆斯只能用肉眼檢查,而侯世達則擁有類似顯微鏡的東西。

你可以不將飛機的發明歸功於萊特兄弟在基蒂霍克的滑翔試飛,而歸功於他們在自行車店裏用廢棄的金屬和舊輪輻造出來的六英尺高的風洞。當他們的競爭者全力以赴地測試有關安裝翅膀的想法時,萊特兄弟正在用極少的錢進行空氣動力學的實驗。他們的傳記作者弗雷德·霍華德(Fred Howard)說這些實驗是“在這麼短時間內用這麼少的材料、這麼微薄的資金做出來的最關鍵、最有成果的航空學實驗了” 。

在布魯明頓北飛斯大街上有一棟舊房子,侯世達在那裏主持流動性類比研究小組(Fluid Analogies Research Group,FARG)的活動。每年的經費是十萬美元。房子佈置得很溫馨——在裏面走一圈,你可能都注意不到食品儲存室裏放着的檔案櫃,客廳裏嗡嗡作響的複印機,還有書架上貼着的圖書館式的標籤(神經科學、數學、知覺)。但25年來,這個地方一直洋溢着激情,侯世達寫道,“首先是探索創造力的祕密;然後揭開意識的面紗。”

計算機對於FARG的意義就如同風洞對於萊特兄弟的意義。人類大腦中稍縱即逝的無意識的混沌可以在計算機上慢播、回放、暫停、甚至編輯。在侯世達看來,這是人工智能的絕佳機會。可以有選擇性地將一個程序的一些部分剝離,看看如果沒有這些部分,會給程序帶來什麼樣的變化;也可以改變一下參量,看看大腦運作是會加強還是減弱。如果電腦發生的變化讓你驚訝——無論是變得特別有創造性或者特別蠢——你都知道具體是爲什麼。“我一直都覺得讓人類徹底明白思維複雜度的唯一希望,”侯世達寫道,“就是在電腦上建立思維過程模型,然後通過這些模型的失敗來學習。”

這些程序都有同樣的基礎結構——組成和整體風格都源於侯世達在1982年寫的一個程序Jumbo,它可以解決報紙上的填字遊戲。(編者注:在這種遊戲裏,單詞裏字母的順序被隨機打亂,然後玩家要找到原來的單詞。)

一個程序居然是用來完成報紙填字遊戲的,你的第一反應可能是,未免太大材小用了吧?的確如此——我剛寫了一個足以應付所有單詞的程序,花了四分鐘時間。我的程序是這樣工作的:羅列幾個字母的每一種排列組合方式,直到發現字典裏存在的單詞爲止。

侯世達花了兩年的時間來編寫Jumbo:他的興趣當然不在填字遊戲,而是大腦在這個過程中是怎麼運作的。他一直在觀察自己的思維。“我可以感覺到字母在我的腦海裏打轉,”他告訴我,“它們跳來跳去,組合、分開、又再次組合。我沒有操控它們,而是它們自己在排列組合。它們在努力自己做着什麼。”

侯世達說,Jumbo的模型結構其實是模仿生物細胞內部的活動。字母的組合與分裂是在“酶”的作用下進行的。有的“酶”負責對字母進行重新排序(pang-loss變成pan-gloss或者lang-poss),有的則負責連接(g和h組成gh,jum和ble組成jumble),還有一些則負責拆分(ight被拆分成it和gh)。這種運算方式的獨特之處就在於其流動性。侯世達又給出了一個類比:一大羣螞蟻正在森林中漫步,一小撮偵察兵先四處查探一番,然後向小組報告發現。它們的反饋可以有效地幫助蟻羣找到食物。這樣的蟻羣是非常有活力的——踩死一小撮螞蟻,其他的螞蟻很快就會補上它們的位置。

圖源:The Atlantic

《流動性理念和創造性類比:思維基本機制的電腦模式》(Fluid Concepts And Creative Analogies,編者注:這是美國亞馬遜公司賣出的第一件商品)詳細解釋了程序所用的這種結構、邏輯和機制。讀一讀這本書,你會覺得,侯世達應該因爲這本書而出名纔對。《紐約時報》的作者曾在1995年的書評中寫道,《流動性理念和創造性類比》的讀者會懷疑印第安納大學那個小組是否正在做一件驚天動地的事情。

但事實上,很少有人知道這本書或者書裏提到的那些程序,連《GEB》的崇拜者們也大多不知道。可能是因爲這些程序都太不實用了,看似瑣碎,甚至幼稚,而且它們還沒有哪件任務是完成得比人類要好的。

現代主流人工智能研究從上世紀九十年代初至今一直穩步前進,不斷取得商業成功,這是誰都沒有預料到的悠長春天,而此前的寒冬差點讓整個行業消失。

由此,我們陷入了一個進退兩難的窘境:一方面,我們只會寫秩序井然的程序,就像訓練有素、等級森嚴的軍隊一樣,每一級的指揮官給下一級下達命令,現在的計算機程序也都是這樣向子程序下達命令的。另一方面,我們想要的程序應該是有適應能力的,這樣一來,層層下達命令的規則似乎是個錯誤的想法。侯世達曾經這麼總結道,“人工智能的所有努力最終都是爲了克服計算機的死板。”

八十年代末,主流的人工智能界已經沒有研究經費,沒有政治影響力,沒有人蔘加研討會,沒有人發表論文,也沒有研究見諸報端。當時最有前途的“專家系統”也面臨坍塌的命運。他們的方法從根本上看來是錯誤的,比如機器翻譯(人工智能長久以來的聖盃之一),把語言學家和翻譯者關到小屋子裏,將他們的專業知識轉化爲程序能夠明白的規則。這種方法最終被證明是一條死衚衕:沒有哪一套規則可以涵蓋一門語言。語言太龐大多變,遵循一條規則就必定會打破另一條規則。

如果要讓機器翻譯像商業公司一樣存活下來——如果希望人工智能能夠存活下來——就必須另闢蹊徑。最好是,捷徑。

事實上,人工智能的確倖存了下來。轉機是從1988年開始的。當時IBM有一個項目叫Candide,一個機器翻譯系統,研發人員從一開始就拋棄了當時流行的基於語言規則的方法,因爲這種方法對機器的要求太高了——機器必須對語言的產生有極爲深入的瞭解:要了解語義、語法和構詞法,要了解單詞是怎麼拼成句子、句子如何組成段落,還要理解詞彙只是通往意義的載體而已。

他們使用的,是一種叫“機器學習”的方法。他們的目標是要製造出一個裝置,輸入一個英語句子,就能吐出一個法語句子。已有的類似裝置當然是人腦,但你又不想跟人腦在“複雜度”上較勁。所以你現在要做的,就是從一個最簡單的機器開始,給它一個英語單詞,它就會隨機吐出法語單詞。

想象一個箱子,上面有數以千計的旋鈕。有的旋鈕控制總體設定:輸入一個英語單詞平均應該吐出多少個法語單詞?有的控制特殊設定:輸入jump這個詞,下一個詞是shot的可能性有多大?問題是,僅僅只是擺弄這些旋鈕,能讓這個機器把英語轉化爲通順的法語嗎?

事實證明,可以。你需要做的就是輸入一些已經知道法語翻譯的英語句子。(比如說,Candide就用了220萬組句子,大部分都來自加拿大議會辯論的雙語文件。)一次只處理一組句子。先輸入英語的部分,看看出來的法語句子是什麼樣的。如果與正確的翻譯不同,說明機器還不夠精確,需要微調按鈕再次嘗試。經過反覆的輸入、嘗試、調整,你對這些旋鈕會越來越熟悉,然後就可以給這些英語句子找到正確的法語翻譯了。

上百萬個句子之後,你的機器會變得越來越精確,即使輸入一個你不知道正確法語翻譯的句子,也能得到正確的結果。這種方法的美妙之處在於,你不需要編寫精準的程序,也不需要弄清楚這些旋鈕爲什麼要這樣轉或者那樣轉。

“機器學習”並非Candide的發明——事實上,早在六十年代,機器翻譯尚在雛形期間,這個概念就被多次測試過了,只是一直沒有成功,直到Candide問世。Candide的真正突破並不在於解決了什麼根本性的問題,而在於它得到了充分的執行。正如Candide小組成員亞當·伯格(Adam Berger)在項目總結中所寫,機器翻譯是“公認的然語言加工中最難的任務之一,在人工智能領域也是如此,因爲如果沒有對材料的理解,準確的翻譯幾乎是不可能的”。像Candide這樣簡單直接的軟件也可以解決翻譯問題,說明有效的翻譯機器並不需要理解詞意——它需要的只是大量的雙語文本。

Candide的方法,其實是轉化問題本身——將一個複雜的,需抽絲剝繭方能解決的問題轉化爲一個累積足夠多的例子就能搞定的問題。模仿大腦運作太難,Candide的方式卻很簡單,而且隨着時間的流逝,問題似乎越來越簡單了,尤其是到了八十年代末九十年代初,萬維網出現了。

人工智能在九十年代的復甦並非巧合,而Google這個世界上最大的互聯網公司成爲“世界上最大的人工智能系統”也同樣不是巧合。這是彼得·諾維格的原話,他是Google的研究主管,與斯圖爾特·羅素合著了《人工智能:一個現代的方法》——諾維格說,現代的人工智能就是“數據、數據、數據”,而Google的數據比誰都多。

圖源:Gifer

Google翻譯是目前世界領先的機器翻譯系統,使用的也是Candide的運算原則。喬什·埃斯特爾(Josh Estelle)是Google翻譯的軟件工程師,他解釋說,“無論你用的是人工智能初級課程裏學到的最簡單的算法,或者學界早已拋棄了的算法,只要把數據從一萬增加到一百億,這些算法都能行得通。”

這種方式非常有效,即使Google翻譯的大部分語種是團隊成員不懂的,也照樣可以正常工作。“這很划算,”埃斯特爾說,“與其僱傭母語人才,不如多請點工程師。”

這就是爲什麼機器學習會在人工智能界成爲美妙的福音:不再需要“理解”,只要掌握好軟件工程的基本知識就可以了。諾維格說,“在Google的發展過程中,這種理念越來越受歡迎。只要將程序的運行速度提高10%,每年就可以省下幾百萬美元的開銷,所以趕緊做吧。怎麼做呢?我們先研究數據,然後用機器學習或是數據統計的方法,做出更好的產品。”

Google也有一些項目是需要深入理解的,比如仿腦生物學的機器學習分支領域;知識圖譜項目,可以將搜索關鍵詞,例如“奧巴馬”,直接映射到人物、地點事物。但十億用戶的需求迫使這家公司更多的捨棄“理解”,而選擇“便捷”。Google翻譯就是一個很好的例子,它爲覆蓋面、翻譯速度以及工程上的便利所做的妥協,明眼人一目瞭然。儘管Google翻譯使用的是人類智慧的成果,它本身卻並沒有智慧,就像巨大的羅塞塔石碑,刻滿了無法辨認的象形文字。

圖源:Dribbble

“製作沃森時,我們有沒有坐下來試圖模擬人類的認知方式?”戴夫·費魯奇(Dave Ferrucci)是IBM沃森研究小組的負責人,他停頓了一下以表強調,“絕對沒有。我們僅僅是試着做出一部可以在《危險邊緣》(Jeopardy!一檔益智競賽節目)中獲勝的機器。”

對於費魯奇而言,“智慧”的定義很簡單:即程序能完成的任務。“深藍”是有智慧的,因爲它擊敗了象棋大師加里·卡斯帕羅夫。沃森也是有智慧的,因爲它擊敗了《危險邊緣》最聰明的選手肯·詹寧斯(Ken Jennings)。“這就是人工智能,對吧?也就是說是非人類的智慧。你爲什麼要期望人工智能科學可以發展出人類的智能呢?”

費魯奇對人腦電腦之間的差別看得很清楚。他喜歡說,沃森需要一整間屋子的處理器,外加二十噸重的空調設備;而它的對手們僅需要一個比鞋盒子還小的裝備,靠一份金槍魚三文治就能運行好幾個小時。比賽結束之後,這個裝置可以讓他們站起來,聊幾句,吃個麪包,爭論一番,跳個小舞,思考人生——而沃森卻只能默默在屋裏嗡嗡作響,又熱又蠢死氣沉沉。

“我們總是低估——五十年代時低估了人工智能,現在還是這樣——這回是人腦。”費魯奇說。

侯世達大概會想問一句:既然如此,爲什麼你不去研究一下呢?

“我對此的感覺很複雜,”去年我問費魯奇這個問題的時候,他是這麼說的,“作爲一個個體,你能做的事情其實很有限。如果你致力於做某件事的話,一定會問自己這個問題:這是爲了什麼?我的答案是這樣的,我對人腦內部運作很感興趣,學習認知科學一定很有意思,我很喜歡讀這方面的書,也很希望可以掌握這方面的知識”——他也認爲侯世達的書非常有啓發性——“但是,我能在這個方向取得什麼成果嗎?我真正想要做的,只是搭建一個可以切實做點事情的計算機系統。我不認爲認知理論能帶我快速抵達這個目標。”

彼得·諾維格的說法幾乎和費魯奇的一模一樣,“我認爲他是在努力攻克一個很難的難題,”他談起侯世達時說,“但我還是更願意去處理簡單一點的問題。”

在這些回答裏,你可以看到人工智能昔日的失敗影響至今。對於本質問題的研究讓人想起早期的難堪。對於聲望的顧慮,尼爾斯·尼爾森(Nils Nilsson)在《人工智能》一書中寫過,已經讓一些人工智能研究者變得毫無用處了。

面對一個問題時,沃森能同時運行成千上萬種算法尋找答案,然後把這些答案匯合,並算出對每一個答案的確信程度。圖源:維基

與諾維格合著《人工智能:一種現代方法》的斯圖爾特·羅素更加激進,“現在正在進行的一些項目都缺乏野心”,他告訴我,“在機器學習領域,八十年代的一大突破就是‘看,這是一些真實數據——我可以用程序來準確預測其餘的數據',而現在的機器學習領域似乎把它當成唯一的任務了。”

被自己的成功所羈絆是很難察覺的。當機器的速度越來越快,得到的數據越來越多,我們就允許自己變得越來越愚蠢。我們不再爲最難的難題絞盡腦汁,而只是在數以億計的數據中加入更多的數據。這有點像用圖形計算器來做高中的微積分作業——除非你真正理解微積分的原理,否則它沒什麼用。

給Google翻譯輸入的數據從一百億增加到一萬億就能夠讓它變成人腦翻譯機了嗎?似乎不太可能。無論搜索引擎、圖片識別、回答問題、計劃、閱讀、寫作或者任何你寧願要人腦而不是電腦來完成的任務而言,都是一樣的道理。

在越來越商業化的人工智能界,包括諾維格在內,人們就算沒有隱約感到害怕,也至少是清楚認識到了危機所在。“我們其實可以畫一條曲線看看:隨着數據量變大,系統是否會越來越好?答案是,系統依然會變好但進步的幅度明顯變小了。”

詹姆斯·馬歇爾(James Marshall)是侯世達以前的學生,對他而言道理很簡單,“最終能帶你走向終點的,一定是艱難的那條路。”

侯世達到了三十五歲纔開始他第一段長期穩定的感情。他說自己生來“諧振曲線就很窄”,借用了一個物理學概念來形容他的極度挑剔。“的確有一些女人曾對我產生重大影響;她們的臉蛋對我的影響意義重大。我也沒法給你細說具體的長相。但這種情況很少見。”1980年,在度過了他口中“十五年黯淡無光的缺愛歲月”之後,他遇到了卡羅爾·布拉什(Carol Brush)。相識不久,兩人便結婚,並生下兩個小孩。1993年,他們一家到意大利度假時,卡羅爾突然因爲腦瘤去世。丹尼和莫妮卡當時分別五歲和兩歲。“我能感到他在卡羅爾去世之後彷徨了很久。”侯世達多年的好友潘迪·卡納瓦(Pentti Kanerva)說。

侯世達整整三十年都沒有參加過人工智能界的大會。“我和那些人沒辦法溝通,”他提起他的同行時這麼說道,“完全不行。雖說我稱他們爲同行,但其實也不能算作同行——我們都沒法進行交談。”

侯世達不經意間會讓我覺得有點難相處。他人很好,但並不健談,也不像受歡迎的老師一樣,會擷取你所說的話中最精彩的部分——將你的觀點融入他們的思想,就好像你的觀點對於他們的論證來說不可缺一般。我旁聽了侯世達和學生們的一場圓桌討論會,他幾乎不曾改變自己的觀點,似乎僅僅是來求得他人的認同的。討論會從一開始就像是他羣發給記者的一封郵件,他似乎只對最熱情的回覆還以最熱情的迴應。

“我不喜歡開會,”他對我說,“我不喜歡去參加會議,然後遇到一羣固執己見的人,他們的想法我不同意,我的想法他們又不理解。我只想和能有共鳴的人交談。”

從十五歲左右開始,侯世達每十年就會讀一遍《麥田裏的守望者》。在2011年的秋天,他在本科生研討課上講述“爲什麼塞林格的《麥田裏的守望者》是一本偉大的小說?”他對霍爾頓·考爾菲德有一種感同身受的親切感。當我提到我高中班上許多同學都不喜歡霍爾頓——他們認爲他就只知道抱怨——侯世達解釋說“那或許是因爲他們沒有看到他的脆弱”。想象一下侯世達像霍爾頓在小說開頭一樣,獨自站在山頂,看着同學們在山下踢球嬉鬧。“我已經有夠多想法了,”侯世達告訴我說,“並不需要外界的激勵。”

當然了,遠離紛爭帶來的後果是你也沒法參與討論。“科學界很少會有非黑即白的情況,”侯世達過去的學生鮑勃·弗蘭治(Bob French)說,“從板塊構造說到進化論,一切想法都需要有人爲其抗爭,因爲人們不會輕易同意或接受這些想法。在學術界的混戰中,如果你不捍衛自己的想法,就只能接受被忽視的命運,而其他人如果積極爲自己的觀點抗爭,即使不太好的想法也可能成爲主流。”

侯世達從來都不想爭取,也不必爭取,這可以說是他事業的雙刃劍。三十五歲獲得普利策獎之後,他立馬成爲了學校的寵兒,獲得終身教職。他不需要在期刊發表論文;不需要讓人審覈自己的文章,也不需要回應他人的評論。他的出版社基本書局(Basic Books)隨時願意出版他的任何作品。

斯圖亞特·羅素很直白地說:“在學術界,並不是說你坐在浴缸裏靈光一現,然後其他人就會對你的發現欣喜若狂,奔走相告。也許再過五十年,我們會說,我們當時真該聽侯世達的。但努力讓人們理解並認可自己的想法是任何一個科學家的職責。”

侯世達常常說,“我只是覺得生命短暫。我只想做我的研究,能不能發表無所謂。”他曾跟我說過一個類比。他說愛因斯坦在1905年的時候就提出了光子假說,但一直到1923年纔有人接受。“整整十八年,只有愛因斯坦一個人相信光是作爲粒子存在的。”

“一定非常孤獨。”

——別走,此處有贈書——

神書《集異璧》(GEB)作者侯世達又出神作,帶你穿過表象的迷霧,探析思考的本質。侯世達親自參與《表象與本質》中文版的封面設計與譯稿翻譯,與三位譯者共同碰撞出中文例子,再現《集異璧》的本土化翻譯創舉。

《表象與本質:類比,思考之源和思維之火》(Surfaces and Essences: Analogy as the Fuel and Fire of Thinking)

“利維坦”(微信號liweitan2014),神經基礎研究、腦科學、哲學……亂七八糟的什麼都有。反清新,反心靈雞湯,反一般二逼文藝,反基礎,反本質。

相关文章