導語

什麼是複雜系統?複雜系統的研究方法有哪些?複雜性科學與人工智慧、深度學習有什麼關係?複雜性科學關注的前沿問題有哪些?這一系列問題是集智俱樂部長期關注的。X-Order日前採訪了北京師範大學系統科學學院教授、集智俱樂部創始人張江,圍繞著「複雜理論」這一主題,分享了他的研究進展,並暢談了他的學術見解和科研經驗。

嘉賓簡介

張江:北京師範大學系統科學學院教授,博士生導師,集智俱樂部、集智學園創始人,騰訊研究院特聘顧問。

2006年博士畢業於北京交通大學經濟與管理學專業,2006-2008年在中科院數學與系統科學研究院的複雜系統研究中心從事博士後研究工作,2008年6月~2012年7月,北京師範大學管理學院系統科學系講師,現為北京師範大學系統科學學院教授。

共發表論文SCI論文二十餘篇,譯著1本。主要關注領域:人工智慧、機器學習、計算社會科學、複雜網路等。他長期積极參与國際學術交流活動,曾先後訪問過美國密西根大學(Michigan University)、佛蒙特大學(University of Vermont)、聖塔菲研究所(Santa Fe Institute)、瑞士弗雷堡大學(University of Fribourg)、亞利桑那州立大學(Arizona State University)等地。2008年獲得北京師範大學第11屆青年教師教學基本功大賽理科組一等獎。2016年獲國家自然科學基金資助項目:互聯網上集體注意力流動研究,批准號:61673070。2011年獲國家自然科學基金資助項目:加權食物網的異速生長律研究,批准號:61004107。

學術&科研

Q:簡單介紹下您現在的研究?

張江:第一項研究是我們正在做的,叫作「圖上的機器學習」。

它是將複雜網路與機器學習結合在一起,來進行的網路上的深度機器學習。我們編寫一些基礎的演算法,再結合具體的實踐(比如跟騰訊研究院QQ數據中心進行合作),用機器學習的演算法分析企業之間所形成的網路及其背後的機制,進而挖掘企業數據背後有價值的信息。

第二項是一個比較前瞻性的研究規劃,叫作「參與的 2050」。

這項研究關心的是環境問題。現在世界的發展體現出兩大特徵:一方面,人工智慧發展的奇點臨近;另一方面,環境在持續惡化,在未來有大崩潰的跡象。兩者結合到一起,就會形成科技發展與經濟進步,跟整個地球系統耦合在一起的系統。

科學技術可以更多地了解未來,我們希望做一些相對實用的預測。這方面的研究工作規劃即將公布。比如說,我們會用系統科學的方法,並結合各種不同的學科,去預測在 2050 年這樣的一個時間節點上世界的環境會是怎樣的。當然了,我們可能要花數十年時間去做這件事情。

Q:當前您研究的這個領域的最大瓶頸是什麼?最有價值的是哪些部分?

張江:我覺得在複雜系統這個研究領域內,研究者們遇的最大瓶頸是我們缺乏一種透徹的認識。因為複雜系統講的都是方法,而沒有一種透徹的觀點。

《規模》這本書就有一些透徹的觀點。作者的視角獨特,而且某些點的分析也比較透徹,比如說對於新陳代謝和生死的關係,在這本書里就凸顯出來了,這些問題都是大問題,特別重要的。這樣研究我覺得在複雜系統這個研究領域中實在太少了。

《規模》所提出的方法,可以回答覆雜科學中的問題。《規模》給出的回答方式不會拘泥於細節,是宏觀的,跨學科的。《規模》一書中討論的生物、城市和公司,就是跨領域的,這是複雜科學的研究所欠缺的,這樣的瓶頸需要我們來突破。

Q:在數字化的未來,您這個領域的研究會有怎樣的演化?

張江:目前數據的收集難度在逐步降低,複雜科學在未來希望藉助這樣的趨勢,結合機器學習、深度學習的一些方法和內容,進行自動建模。

複雜理論

Q:目前對複雜理論還沒有一個非常成熟的定義,您覺得應該如何定義複雜理論?

張江:複雜理論現在還沒有一個準確的定義,但這並不影響我們在複雜理論領域內進行研究。給「複雜理論」下定義沒有太大的必要,這不是進行複雜理論研究的必要條件。就像我們對「生命」沒有明確的定義,基本上都是一些描述性的定義,但是這並不妨礙我們去研究生命。

Q:請問您覺得複雜網路、複雜系統、複雜理論之間有什麼關係?ABM在複雜理論研究中是一個什麼角色?

張江:首先我想講一個另外的詞——「系統科學」,系統科學與複雜網路、複雜系統以及複雜理論之間的關係是什麼呢?

首先,系統科學的概念更大、更全面,包含了複雜系統和複雜科學。

從另一個角度,複雜網路、複雜系統以及複雜理論是系統科學發展到一定階段以後所形成的一個子領域。

最後,系統科學還包括工程理論、控制論、資訊理論以及自組織理論等等。航天工程、登月工程之類的大型工程都需要用到系統科學的理論,特別是系統論的一些方法。

所以,系統科學這個圈子是更大的,而複雜科學是在二十世紀九十年代以後發展起來的。

那麼系統科學和複雜科學的區別在哪裡呢?

最大的區別在於複雜理論研究活系統現象,而系統科學更多地是研究「死系統」,比如說一些沒有活力、人造的,不像生命體那樣有活性的對象。複雜科學更感興趣的是活的系統,活的系統其實有很多,包括生命系統、計算機網路系統(某種程度上也是活的演化系統)、社會經濟系統(它內部的每個單元都是活的,所以整體上也是一個活系統)。

複雜科學是一門研究對象具有活的性質的學科。

對於第二小問——

複雜科學是門比生物學還要不成熟的學科,處於發育不完全的狀態,它給我們提供的並不是一套成熟的理論,而是另外的兩個內容:

第一,複雜科學給我們提供了一個思維框架,它跟哲學一樣,告訴你該從哪個角度,從哪些概念出發去思考。給我們的是一些概念,比如:「湧現」、「進化」以及「分形」。

第二,複雜科學給我們提供了一套工具箱,這個工具箱裡面有很多研究方法和工具。比如說題目中所提到的「複雜網路」就是這個工具箱里的工具,我們用「複雜網路」這個工具就可以去研究一個網路中的結構特性以及相互之間的關係;還有就是像 ABM 模擬模擬方法,其實也是其中的一個工具,它的特點就是,我可以去給電腦之中的 Agent 設定最簡單的規則,讓他們相互作用,用模擬實驗的手段,去觀測演化的過程。

ABM 模型做出結果是不能證偽的,是這樣的嗎?

ABM 模型做出來的東西是可以驗證的,主要是看用這個模型來建模什麼問題,如果建模的問題本身就是比較「虛的」問題,比如說就是人造的生態系統,就很難證偽。但是如果說建模一個比較具體的,比如說要模擬一下比特幣網路的演化,比特幣有大量的數據,ABM 模型做出的建模就可以跟實際去比對,自然就會驗證這個模型,所以說是可以證偽的。

Q:您覺得複雜系統、複雜理論這樣一個跨學科研究,與以前的研究方法相比有什麼優勢?可以解決哪些傳統方法解決不了的問題?

張江:相對於傳統的研究方法而言,其優勢主要體現以下兩方面:

第一,複雜科學所進行的研究屬於綜合性的研究,我們去識別一項研究是不是複雜性研究可以參照兩個評判標準:首先,它是不是跨學科的?舉個例子,生物學只研究分子,研究分子之間很具體的一些機制以及相互作用,所以生物學的研究不能歸屬於複雜系統的研究,因為它太具體了;而「分形」就比較符合複雜性研究的定義了,「分形」這種現象,可以放到很多不同的系統裡面去。比如社會系統、生物系統、計算機系統以及人工智慧系統都有這種「分形」的現象。

第二,複雜系統比較強調整體觀,比如湧現理論,其中很多特性不是歸結於單一個體的行為,而是一種整體、結構性的東西,這種現象也是複雜理論側重研究的現象。

Q:在利用模擬模擬去研究一些複雜的現象是,我們通常會設置很多的參數,有文獻中提到,幾乎模型中想要刻畫的個體的種類數與設置的參數增加是同等比例的增加的,但是過多的參數又會導致我們不知道哪個因素影響了最後行為或者現象的出現;所以面對參數數量過多與複雜現象刻畫之間的矛盾業內是如何解決?

張江:這也是我們做系統建模時經常會頭疼的一個問題,需要設定太多的人為的規則和人為的參數,這個該怎麼解決呢?

第一種方法我們一直以來都在採用,就是在建模之後要做校驗和校準,這也是件很重要的事情。

這些校驗校準的過程就是對這些參數來設定數值。其中一種途徑是這樣的:如果知道一個參數在實際系統中的意義的話,那就直接去套系統中的參數。比如說,在模擬一個市場的時候,需要加入收入分布的情況,這當然可以隨機去設置參數,不過這樣很不好;另一種途徑就是通過調研去獲取一些數據。比如說,要了解中國市場中的收入分布情況是什麼,把這個(調研獲取的)收入分布曲線直接放到模擬里就可以了。所以這樣的做法可以大大削減工作量,並提高參數設置的客觀性。

第二種方法是通過機器學習的方式,去調整這些參數。

這其實在早期就有,人們在對股票市場進行模型模擬時會做平行實驗,平行地去做真實的股票市場和模擬的股票市場。

讓模擬模型中的 Agent 去學習真實的股票市場是怎麼運行的,然後用演算法去做,所以通過這樣的學習就可以得到相應的參數。

第三種方法也是一個新的方向,就通過機器學習,自動設置參數。

複雜理論+

Q:利用複雜理論去研究一些實際現象與目前很火的利用機器學習、深度學習做研究有什麼關係和區別?

張江:我們複雜理論研究領域或者說系統科學研究領域的學者更多地會將人工智慧看成系統科學的一個分支。因為很早以前系統科學就在做人工智慧相關的一些研究,比如系統辨識、系統學習、系統決策以及系統控制等等。所以很多系統科學領域的學者將人工智慧理解為系統辨識的一部分。當然了,這種說法仁者見仁智者見智。

機器學習和深度學習,跟複雜理論一樣都是工具箱,那麼這兩個工具箱有什麼區別和聯繫呢?

首先,傳統的複雜理論,複雜網路也好,ABM 也好,它們都是正向推理的關係——面對一個真實的複雜系統,比如說來研究一個區塊鏈系統,複雜網路或者 ABM 的方法,總是要去假設一些簡單的規則,就是人們通過分析數據來構造一些規則,然後再進行推理。機器學習和深度學習則可以做到歸納,使得實驗反饋變得更快速,收斂地更快。從這個角度來說這兩套工具還是很不一樣的,而且形成了一種互補。

Q:您覺得複雜理論的研究是否可以人工智慧相結合?如果可以,如何將複雜性思維應用到人工智慧的領域?

張江:複雜理論本身就是一個思維框架,如果說人工智慧就是按照複雜理論這個思維框架而發展起來的也不為過,比如自學習、自演化這些人工智慧的概念其實也包含與複雜理論。所以人工智慧完全可以與複雜理論結合起來,比如說我們集智做的圖形識別的機器學習就是體現,我認為將兩者結合起來的應用空間還是非常大的。

Q:阿瑟早期研究複雜經濟學的時候提出過人工股票市場模擬,您在早年間也做過類似的研究,但是發展到現在幾乎沒有這方面的研究了,這是為什麼?

張江:人工股市在上個世紀九十年代至世紀末的時候很熱很熱,因為那時沒有大數據,或者說沒有意識到大數據的作用。所以大家就比較喜歡去做這種計算機模擬,去模擬人工股市或者說人工經濟系統等等,這就是人工股市誕生的背景。

兩千年以後,隨著複雜網路以及大數據等科技領域的發展,人們就越來越意識到就是不能單憑機器去做模擬,總是要跟實際去結合,一種結合的方法就是用模型去跟實際結合;另一方法是直接去研究數據,藉此來反推模型應該是怎樣的。

先收集大量的數據,通過數據分析來提煉規律,最後再去建模,這被人稱為經濟物理或者說物理金融。目前仍有不少學者在做這方面的研究,區別就是在於現在不只是做模型,有相當一部分研究是結合具體的數據來做的。

Q:基於複雜理論的視角,如何衡量商品或技術的價值?

張江:我認為價值的形成跟生產過程有關。在產品的生產路徑中需要人類付出一些勞動,比如說算力或者腦力等等。

所以如果能把商品生產路徑全部記錄下來的話,那麼從原則上來講,就可以把價值計算出來。

在此我想做個延伸,就是如何定量化人類的腦力?

目前來看,設計一個產品不能單用機器來做,一定會牽涉到人力資源,特別是腦力資源的投入。我們需要有一套定量化人類腦力勞動、腦力資源的一種技術手段,我認為得到了能測量勞動者在一件產品上花費多少腦力資源的方法,很多問題就會解決,包括價值的衡量。

當然了精度上不好說,但可以大致地衡量勞動者在一個東西上花費的時間,所以如果能把時間定量化的話,就可以度量價值。

雖然沒有天然的工具來度量腦力資源,這個領域是空白,但目前也有了一些嘗試性的解決方案,比如谷歌眼眼鏡,它就可以從某些維度上測度人的注意力。

價值可以大致地測度,但是對商品或技術進行定價就太度雜了,因為這牽涉到了需求。價格跟需求有關,而且需求又分不同的層次,比如說真實需求和炒作需求的分層。所以給一件商品或一種技術定價很複雜。

如果讓我研究的話,我就用模擬的方式,就是完全從模擬的角度來定價,當然了,這樣的劣勢就是只知其然而不知其所以然。

Q:結合規模法則,從複雜網路的角度看,您覺得如何看待區塊鏈這樣一個由眾多節點組成的分散式網路的價值和發展模式?

張江:複雜理論的研究分成幾個階段:

上世紀九十年代,對於 ABM 模擬模擬方法的研究比較多;2000 年以後的主流方法是複雜網路;2010 年至今,基於大數據的複雜性理論研究是主流。

我們反觀區塊鏈,區塊鏈比較有趣的一點就是鏈上的數據全是公開的,每個環節,每個買賣,其實都是有數據記錄的。但現實世界的交易很多是不公開的,這就區塊鏈的相對優勢。

所以我們用複雜網路的方法,用《規模》的方法去分析這些數據,也許可以挖掘出來很多本質的科學問題。

Q:如果將複雜理論應用到互聯網上大眾關注點演化的研究上,您覺得最應該關注的是哪些方面?

張江:我們曾經做過一些研究,這被我們稱之為「集體注意力」,這也類似於題目中所說的「互聯網上大眾關注點的演化」。我一個博士生的畢業論文就是在研究這個問題。

這項研究現在的一個缺點是我們獲取的數據集比較小,也比較老。我們現在嘗試著獲取和分析互聯網上數據,Domain(域名)相關的數據是我們的標的。

我們會統計網站的用戶訪問量,各個網站之間流量轉移情況等等,通過使用一套網路的方法來分析這些數據,然後將其可視化,觀察它的演化趨勢,最後就是做預測。

這項研究的進展就是,我們知道了這個生態系統大致輪廓是什麼樣子的:從可視化的角度,現在可以看到有幾個聚類,並且已經出現了中心性,處於中心的節點,恰恰是最重要的節點。除此之外,我們也在優化預測,原則上用這些方法可以預測到黑馬網站,預測到將來哪個領域會崛起,哪個域名會漲起來。在研究的過程中我們也發表了一些論文。

這項研究與 KOL 的研究有什麼不同呢?

我認為首先是視角不同,我們的研究是基於連接的視角,而 KOL 研究是從內容的視角出發的。

其次是研究對象,KOL 研究的是內容網路和社交關係,而我們不是。

開放問答

Q:您能推薦一本最近對您影響最大的書?

張江:《規模》是最近對我影響最大的書。

其實我去年所做的研究就是跟 Geoffrey West 這本書中所使用的研究方法一樣,我在以前也自認為對 Geoffrey West 的理論有所了解。但是在讀完了這本書,當它完整的思想展現到我面前的時候,我再次被震撼到了。我開始重新認識 Geoffrey West 這個人,重新認識這本書,發現了書中的很多閃光點。

複雜理論講的是方法,講是理論的ABC,而《規模》這本書觸及到一些本質的問題,對於生死這類本質的問題,它就敢於回答,並給出了一定的答案。比如說人為什麼最多能活到一百二十歲,為什麼呢?這本書給出的一個答案是跟人的「規模」有關係,就這一個簡單的點,我認為就是一個很大的突破。

另外一點,也是容易被讀者忽略的一點,就是《規模》這本書談到了未來的一個可能性——人類社會面臨著崩潰的可能性。這幫我們的「參與的2050」指出了方向,就研究經濟增長和環境之間的關係,這也是 Geoffrey West 認為的搞人工智慧很容易忽略的點,而這是非常重要的一點,確實需要把這兩者聯繫起來。

這本書給我們看到了把經濟發展和環境演變聯繫起來的可能性,所以我們決定,在未來會花幾年甚至幾十年的時間去研究這個問題,把它當成一個任務去做。還有我覺得也恰恰只有系統科學才能研究這個問題,因為其他任何一個學科,都太單一了。而這個問題是需要把很多不同的學科,聯合在一起的,所以說《規模》這本書對我影響很大吧。

Q:關於《規模》這本書,作者 Geoffrey West 提出的解構複雜世界的簡單邏輯——「規模法則」您是怎麼理解的?

張江:統計學,熱力學物理,就是《規模》這本書所採納的方法,這套方法跟Agent 建模以及複雜理論不太一樣,Agent 建模很大的一個特點,就是它的簡單性:我們一想到複雜理論就會想到微觀的、細節的一些方面,比如做股票市場的模擬,就需要對 Agent 賦予一些規則。但是《規模》的思路就完全不是這樣,它是放棄了微觀的東西,只去抓取最重要的、最宏觀的東西。

對於一個複雜系統而言,它最重要的東西,恰恰就是規模,也即尺度的大小。《規模》這本書就牢牢抓住了「尺度」這個宏觀的量。當然了,只看一個宏觀量沒有意思,要看多個宏觀量之間的關係。

我認為所謂的「規模法則」,就是兩兩宏觀變數之間的關係,比如說新陳代謝和體重的關係,GDP 和人口的關係。

那麼這樣簡單的東西會給我們什麼好玩的東西呢?

其實在這麼一些簡單的東西裡面,我們恰恰能挖掘出一些很有價值的、很有意思的東西。這些東西是什麼呢?比如說去了解不同系統的新陳代謝就非常重要,幾乎所有活的複雜系統,都是有流入流出的——也就是能量或信息的交換。順著新陳代謝繼續往下探究,就必然會發現一定的結構,這些結構以網路的形式呈現,網路從小變大的過程不是任意進行的,它的演變必須是滿足一定規律地去進行。比如生物的新陳代謝,我們通過挖掘,就會發現網路中的輸運系統——毛細血管運行的一些規律。

這本給我們提供了一些原則,我們利用這些原則,推測出很多結論。

為什麼生物體的心跳數是三十億次左右,這就跟它的網路結構有關,與規模法則也是密切相關的,我們可以用規模法則推理出心跳的次數。再比如說,哺乳類動物的細胞大小,有一個最小的尺度,這個最小的尺度是能夠用規模法則被推算出來的。

規模法則可以在生物系統中發揮預測功能。同樣的,這樣的方法也可以套用到城市和公司的研究中去。對於這兩個領域我們都有參與,我們通過這套研究框架研究過城市和公司的結構,並得到了一些定量結果。

這些結論的特點在於:

一、具有很強的定量性,很精確;

二、具有宏觀的特性,能從整體上觀測。

而它的弱勢在於,它沒有解釋微觀的東西,比如股票什麼時候漲什麼時候跌,這類的問題它沒辦法回答。

總結而言,《規模》這本書給我們提供了不一樣的視角。

Q:您覺得人類該如何適應未來的人工智慧社會?

張江:即便人類真的成為了人工智慧的奴隸,我覺得知道這個事實也無所謂,這麼假設和不這麼假設其實沒多大區別。

我覺得人類的核心價值就在於人性:什麼是意義,人最基礎的慾望以及人們感興趣點是什麼等等。這是不變的東西,也恰恰是你可以拿來應萬變的東西。

機器會產生意識嗎?

從目前的角度來看,首先我們不知道什麼是意識。

我的一篇文章曾經討論過這個問題,一些實驗的結果表明,人的意識分兩套系統:一套系統用來描述,一套系統用來體驗。如果從這兩個角度去看的話,人工智慧是可以產生意識的。而且我還指出了一個具體的機器模型,叫作「哥德爾機」。雖然「哥德爾機」只是一個設計方案,還沒有變成一個可運轉的機器,但 Schimchuber 堅信這個機器可以看作是具有自我意識的系統。

所以說,我對這個問題的回答是,我們似乎沒有看到有任何的不可能。

Q:普通人如何把握最前沿的科技進步所帶來的紅利?

張江:像互聯網這產業種思維方式,最近幾年的創業套路其實就是在佔一個一個的坑,雖然在一個一個領域產生了寡頭,但卻變得非常的富饒,就是只要你想得到東西其實都有人在做,都能找到對應的點是什麼。

現在有很多線上線下的活動,還有一些科普的公眾號,其實途徑並不缺。但是普通人跟著熱點跑是永遠跟不上的,與其跟熱點,不如以不變應萬變,就是回歸到自己內心的本質,挖掘自己的夢想,問自己最想要的東西是什麼。

Q:怎樣才能發現自己的興趣?

張江:這是牽扯到了人生觀的問題,我認為理想化的狀態是,學會自己與自己交流。我相信每個人都有自己的興趣點,只不過當下這個社會讓那些有自己興趣的人都慢慢地放棄了自己的興趣。看到身邊的很多朋友就被一些東西所左右,其實也包括我自己,也會有一些動搖。當然動搖的都在於小的方面,大方面是比較堅定的,小的方面就會被媒體或者朋友的一些說法所左右,所改變。

如果有很強的興趣點,知道自己想要幹什麼的話,就不需要找了,也不需要去聽別人的意見,直接挖掘自己的興趣點就好了,挖掘下去。互聯網時代跟以前不一樣,它很富饒,而且多樣性很強。你如果有自己的興趣點,而且挖地比較深,那你就可以在這個社會上立足。

如果暫時還沒有發現自己的興趣點,那就多花些時間和自己對話,進一步地去挖掘自己。

本文經授權轉載自 代觀

推薦閱讀

盤點2018年21本必讀的複雜性科學新書好書

複雜性科學入門書單——十本書帶你進入複雜性領域

複雜性科學從入門到精通,這十本專業書必不可少!

《多樣性紅利》新書:複雜性背後的模型思維方式

加入集智,一起複雜!

推薦課程

PC端地址:

campus.swarma.org/gpac=


集智俱樂部QQ群|877391004

商務合作及投稿轉載|[email protected]

◆ ◆ ◆

搜索公眾號:集智俱樂部

加入「沒有圍牆的研究所」

讓蘋果砸得更猛烈些吧!


推薦閱讀:
相关文章