我們總被成功的風光吸引,企圖從成功的案例中找到可複製的路徑,對“失敗”的認識卻不夠清晰。近日,美國西北大學凱洛格商學院、複雜系統研究中心副教授王大順等人在預印本平臺上發佈了新論文 Quantifying dynamics of failure across science, startups, and security。在該論文中,研究者闡述了失敗的動力學機制。從動力學所得到的早期信號中“明察秋毫”,或許勝敗早有伏筆。


來源  公衆號“集智俱樂部”

作者  Leo

編輯  王怡藺


我們是焦慮的,我們對成功亦有執念。面對如此龐大的“成功需求”,市面上的“成功學”書籍可謂汗牛充棟。然而成功的道路並非一帆風順,福特在創辦他的福特汽車之前破產過兩次;J.K.羅琳的哈利波特書稿被出版社拒絕過十二次;更不要說“中學生作文中的老朋友”——愛迪生,在發明燈泡的過程中,他爲了找到可以長時間點亮的燈絲經歷了千餘次的失敗。


雖然我們都知道“失敗是成功之母”這句格言,然而,我們對於失敗的理解卻少之又少。近日,美國西北大學凱洛格商學院、複雜系統研究中心副教授王大順等人發表了最新的論文,開創性地闡述了失敗的動力學機制


論文題目:
Quantifying dynamics of failure across science, startups, and security
論文地址:
https://arxiv.org/abs/1903.07562



三個有關“成敗”的大型數據集


爲了完成這項研究,研究者們使用了三個異常巨大的數據集:


  • NIH Grants

    1985 年至 2015 年期間,提交給美國國家衛生研究院(National Institutes of Health,NIH)的所有與健康有關的科研經費申報。因爲美國國家衛生研究院是世界上最大的生物醫學研究領域的資助者,因此在 1985 年至 2015 年期間,該機構提供收到了來自  139,091 名研究者的 776,721 份經費申報數據,並附有經費申報成功與否的信息。研究者能通過整理申報者的歷次經費申報信息,從而提取出在經歷多次失敗最終獲得成功的“生物醫學研究員奮鬥史”。


  • Startups

    由美國風險投資協會(National Venture Capital Association)提供的 VentureXpert 數據庫,包含了從 1970 年至 2016 年,由 253,579 名創業者創辦的 58,111 個公司的數據。同樣,通過這些數據研究者可以重建創業者的歷次創業經歷,並將創業成功定義爲:進行 IPO 或被大公司收購。


    注:首次公開募股(Initial Public Offerings,簡稱IPO)是指一家企業或公司 第一次將它的股份向公衆出售(首次公開發行,指股份公司首次向社會公衆公開招股的發行方式)。


  • Terrorist Attacks

    記錄了 1970 年至 2017 年間的 3,178 個恐怖組織策劃的 170,350 起恐怖襲擊事件。這項數據來自於全球恐怖主義數據庫(Global Terrorism Database,GTD)。把襲擊成功定義爲造成了至少一人的死亡;無人傷亡則表示襲擊失敗。



運氣與學習


通常,我們認爲一件事情的成功還是失敗主要歸功於運氣(Chance)和學習(Learning)。研究者利用以上三個數據庫檢驗這兩項假說是否可靠。


運氣模型


如果運氣是成功與否的關鍵因素,也就意味着一件事情完全是由概率決定的。比如說,做一個事情成功的概率和拋硬幣正面朝上的概率一樣都是 0.5,那麼多拋幾次,得到正面朝上的機會(至少有一次是正面的概率)就會增加。


這種事情,做一次嘗試和做一百次嘗試都是一樣的,所以第一次嘗試的成功概率會等於倒數第二次嘗試的成功概率(最後一次表示事情最終終於成功了)。且如圖所示,失敗曲線(Failure Streak)會完全吻合指數函數的圖像。


運氣模型以及對應的失敗曲線,左側表示的是首次嘗試和倒數第二次嘗試的概率,右側表示的是多次失敗的互補累積分佈(CCDF)。


學習模型


如果,事情的參與者能夠從先前的失敗中學習經驗教訓,那麼後續嘗試的成功概率會就會大爲增加,換句話說,和第一次嘗試相比,倒數第二次嘗試的失敗可能性會降低。就函數圖象而論,失敗曲線的“尾部”會比指數函數的尾部要“窄”。


學習模型的表現圖示,以及對應的失敗曲線。左側表示的是首次嘗試和倒數第二次嘗試的概率,右側表示的是多次失敗的互補累積分佈(CCDF)。


但是,當研究者用以上兩種假說去表述先前提到的三個數據集中的真實案例數據時,研究者發現,實際的失敗曲線的尾部比指數圖像的尾部還要寬一些。顯然,單一的運氣和學習模型都無法解釋人爲何會成功和失敗。或許,是這二者共同作用才造就了最後的結果。


NIH Grants、Startups、Terrorist Attacks三個數據集真實案例所反映出的表現結果與失敗曲線



建立新模型


那麼,“失敗”到底受到了怎樣的影響呢?研究者從一個簡易的單變量模型入手研究失敗的動力學機制。


嘗試與部件


嘗試、部件及其更迭模式,左圖表示一個包含多個部件的事情,如何經過多次嘗試之後,每個部件的分數均得到提升的過程;右圖表示創造新部件還是沿用就部件的決策過程。


如上圖 a 所示,首先,研究者假設,每一次嘗試都包含了不同的部件(component)。例如以申報研究經費爲例:申報一次生物醫學研究經費(嘗試)需要計算預算、編寫數據管理規劃、預估研究影響等等部件。在本研究中假設這些要素的分數 x 是獨立無權的(權重爲 1)。分數越高,該次部件也越可能成功。


當經歷過一次失敗,再做一次嘗試的時候,參與者對其中的每一個部件的處理方法是:

  1. 以概率 p 創造一個新的(圖 a 中的綠色箭頭)。

  2. 以概率 1-p 沿用過去最好的版本 x*(圖 a 中的紅色箭頭)。


參見上圖 b,在評估這些部件分數的時候是隨機給出一個 0 到 1 的數值(由運氣決定是否成功)。但是考慮到實際情況。人們在給出一個新版本的部件時,會考慮到先前部件的質量——創造新版本的動力(概率 p)被設定爲與 1-x* 單調相關。換句話說,如果過去做的最好的結果(x*)越差,人們越有動力去改進它。同時,在研究者的模型設計中,每多設計一個新的部件都要多花費一個單位的時間。


這個思路類似於遊戲打怪升級裝備,遊戲玩家在購買、升級新的遊戲裝備的時候,不是土豪任性,隨意氪金。而是會根據已有的裝備能力進行選擇:還不錯的裝備會留着繼續用, 越爛的裝備越有可能被替換掉。而打造更強大的遊戲裝備也是要花費時間的。


故此,研究者爲模型設定了一個單一的表示學習數量變量 k。該模型稱之爲:k 模型(The k model)。


k 模型


k 模型(The k model),從質量和效率兩個角度來評估兩種極端的k模型的結果。


當 k 等於 0 時(圖中以橙黃色標識),意味着做出新嘗試的人不考慮過去的嘗試,每一次新的嘗試都與過去的嘗試無關。這時模型就退化爲了運氣模型。


當 k 趨近於 ∞ 時(圖中以藍色標識),意味着要考慮過去所有的嘗試。我們可以用這個模型來估計失敗動力學的時間尺度——學得越多越能節省時間。


同時,研究者也評估了兩件指標,每次嘗試的質量和效率。在 k=0 這樣的運氣模型中,反覆嘗試並不能帶來總體質量和效率上的提高改進(圖 c、f),最後的成功與否完全取決於撞大運。而在另一個模型中(圖 d、g),因爲有經驗的積累,我們明顯能夠看到質量(評價分數 x,圖中以 1-x 減小表示質量增高)與效率(T)的改進。



三級相變與臨界的魔力


一個新的疑問是:從“啥都不學”到“學習一切”這個變化是一個漸進的過程麼?或者說,k 值的變化能帶來成功概率連續的改變麼?


由兩個閾值點帶來的三級相變過程,只有當k值大於一定的臨界值時,學習纔能有效果。


根據研究者的研究表明,學習的程度是存在閾值的——學習對失敗的影響被限定在了一定的範圍內。換而言之,隨着 k 從 0 增大到 ∞,在相當長對的一段時間內,因爲學習的經驗太少(k太小),學習的質量和效率都很低,學了跟沒學效果一樣(圖 a 中的橙色部分)。但是,超過了一定的範圍,我們也會發現,失敗的動力學特徵和 k=∞ 時,基本相同。也表明,只要學習的內容涵蓋了足夠多的嘗試經驗,其結果跟學習過往所有的經驗差不過。


就此,我們發現失敗的動力學是一個存在兩個閾值點的三級相變過程。


舉例來說,也許兩個人的學習能力相差不大,但恰好處於臨界值的兩側最後的學習質量和學習效率都相距甚遠。超過臨界狀態的人能從過去的學習中受益,但恰恰低於臨界狀態的人卻幾乎是止步不前。


位於臨界狀態兩側的學習效果實例



關於失敗的四種預測


基於上述的模型分析,研究者提出了四種預測,並在他們的數據集中進行了測試。


  • 預測一 :不是所有的失敗都能帶來成功。


成功組(藍色)和非成功組(橙色)失敗次數的互補累積分佈(CCDF)


如圖我們可見,在三個領域中都存在這一部分人一直無法獲得成功。且每個領域中、每個失敗次數的細分類別中,成功與不成功的比例也幾乎一致。或許,當有一天我們獲得了成功時,不要忘了我們身後那些鍥而不捨卻又屢戰屢敗的人們。


  • 預測二 :根據動力學信息所得到的早期信號,就足以將成功者和無法獲得成功者分離開。


早期的信號就能將成功與失敗分隔開,折線和陰影區域分別表示樣本均值與方差


因爲失敗動力學作遵循的是冪律規律,即使是個體微觀行爲上的一點點差異也能在後期帶來巨大的分流。這二者的分流其實在早期就以註定。


  • 預測三: 實際能力的提升導致了分流的出現。


通過兩次嘗試的對比可以看到成功組和非成功組的學習能力差異巨大


通過觀察上圖我們可以發現,同樣是經歷失敗,成功組和不成功組在經歷失敗後能力的提升並不相同。研究者通過這一思路也解決了,在觀測三個來自真實數據庫的數據時的疑問:爲什麼學習失敗經驗有用,但失敗曲線的尾部卻比較的“長”呢?研究者表示:成功與不成功的區別主要在於對待以往嘗試中部件的複用上。


確實,學習以往經驗、複用以前的部件能夠保留足夠優秀的資源,但也會使人們死死的攥住一個不太好的事物不肯放手,長時間的處於欠優的狀態中。實際上,研究者在通過對真實數據的研究發現,那些事情進展停滯不前的人們並非倦於工作、懶於學習,而是做了太多不必要的事情。


而最終,研究者得出結論——


  • 預測四: 失敗曲線的長度服從韋伯分佈(Weibull distribution)。


這就意味着,做一件事情在多次失敗後,只要擬合了失敗曲線的形狀,我們就可以估計出該事件的未來的時間表:到底能否成功?何時會成功?



失之毫釐,謬以千里


以上這些結果表明,如果一次嘗試的失敗是構建在前期失敗的基礎之上,就能在早期階段,通過重複失敗的動力學信息刻畫出相關的統計特徵。傳統上,人們會把勝敗歸功於運氣、學習能力、和個體的差異。而本論文的研究者通過他們所構建的新模型給出了新的觀點——


即使個體間的初始差異並不大,但在經過反覆的學習過程後,所表現出來的結果卻有着天壤之別。


正所謂:君子慎始,差若毫釐,謬以千里


參考報道:

  • How the data mining of failure could teach us the secrets of success

    https://www.technologyreview.com/s/613229/data-mining-reveals-the-hidden-secret-of-human-failure-and-how-to-turn-it-into-success/


本文轉載自公衆號“集智俱樂部”(ID:swarma_org)



更多故事,盡在👉領研網科研生涯頻道

▽ 精彩回顧 ▽

相關文章