導語

今天我們將帶大家來學習一個基本的概念,就是冪律分布的函數形式。這部分的知識來自於集智百科,集智百科是複雜系統領域的百科全書,涵蓋複雜系統領域的基本概念。(目前正在不斷的完善階段)

我們正在組織撰寫翻譯相應的維基詞條,並附上代碼實現。想要自己創建詞條,一起貢獻知識的小夥伴們可以通過鏈接報名哦。點擊「編輯」,做些改變,按下「保存」,你將影響世界!

冪律函數(Power-Law Fuctions)

科學家對冪律關係感興趣,部分是因為某些機制服從冪律關係所展示出的簡潔性。通過研究冪律把握這些機制,不僅了解到一些自然現象的基礎,還可以從中窺探出與其他看似不相關的一些系統之間的深層聯繫; 參見前文的普適性 。

物理世界中冪律關係無處不在, 部分是由於維度的限制;而在複雜系統中, 冪律通常被認為是層級或特定隨機過程的特徵。帕累托的收入分配定律, 分形的結構自相似性, 以及生物系統中的克萊伯定律,都是比較著名的冪律分布實例。

研究冪律關係的生成, 並致力於在現實世界中對它進行觀察和驗證, 是物理學、計算機科學、語言學、地球物理、神經科學、社會學、經濟學等許多領域研究的一個熱門話題。

帕累托收入分配定律 | 來源:https://www.google.com

最近對冪律的興趣主要來自於對概率分布的研究:似乎有大量的分布遵循冪律的形式,至少它們右尾是符合的。這些大型事件的行為將這些數量與大偏差理論(theory of large deviations)的研究聯繫起來(也稱為極值理論(extreme value theory)),它探究了諸如股市崩盤和大型自然災害等極其罕見的事件的發生頻率。在統計分布的研究中更傾向於稱之為「冪律」。

在實際情況中,近似為冪律分布的情況

通常包括一個偏差項,它可以表示觀察到的值

的不確定性(可能是測量或抽樣誤差),或者提供一種簡單的方法使觀察偏離冪律函數(可能是因為隨機):

從數學角度來說,一個嚴格的冪律函數不可能是概率分布:

,對於

,指數

(希臘字母 alpha,注意不要與之前使用的指數符號混淆)大於1(否則尾部具有無限區域), ,最小值

是必須存在的。否則,當x接近0時, 分布就具有無限面積, 常量因子C是一個標度因子, 以確保總面積為 1, 這是概率分布的基本要求。

更常見的是漸近冪律——只在極限情況下成立。指數通常在

之間,不過這並不絕對。詳細信息請參閱下面的冪律概率分布(power-law probability distributions )。

示例

從物理學(例如沙堆雪崩),生物學(例如物種滅絕和體重)以及社會科學(例如城市規模和收入)領域的研究中,目前已經探討了超過一百種冪律分布。其中包括:氣溶膠光學中的Angstrom指數、複雜介質中聲衰減的頻率依賴性、心理物理學中的Stevens冪律、斯蒂芬-玻耳茲曼定律(The Stefan–Boltzmann law)等等,下面就簡單介紹三個應用最廣泛的示例。

克萊伯定律(Kleibers Law)

在1932年,生物學家克萊伯做了一組實驗,他將各種哺乳動物拉到稱上稱體重作為橫坐標,大到幾頓重的大象,小到幾十克的耗子,然後通過它們在單位時間內呼出的二氧化碳,分別測量出它們的新陳代謝率作為縱坐標。

得出的結果讓他大吃一驚。當橫縱坐標分別取對數之後,所有的動物都齊刷刷地站在了一條直線上,這條直線的斜率為3/4。生物的多樣性令人嘆為觀止,可竟然出現了在數學上如此統一的規律。

這就是克萊伯定律(Kleibers law):對於哺乳動物,其基礎代謝率與體重的3/4次冪成正比

想了解更多關於克萊伯定律的知識,請看集智學園最美程序媛的作品:

克萊伯定律揭秘生命第四維 | 《規模》

無標度網路模型

早期研究發現在很多網路中,少數節點佔據了整個網路中的大部分連邊,而多數節點的連邊數量很少,節點連邊數量的分布符合冪律。以巴拉巴西為代表的科學家們發現了大量滿足冪律的網路結構,這種網路被稱為無標度網路。人們越來越傾向於認為,冪律(Power Law)是無處不在規律,尤其在複雜網路中。

隨機網路

想了解更多關於無標度網路模型的知識,請看集智俱樂部往期作品:

最先發現無標度網路的人竟然是他!?解讀冪律分布與無標度網路 | 長文綜述Love is All You Need | 無標度網路理論之父Barabási回應史上最嚴重質疑理論危機 | 無標度網路遭到史上最嚴重質疑

Zipf定律:書籍中單詞頻率的分布

Zipf定律是由哈佛大學的語言學家喬治·金斯利·齊夫(George Kingsley Zipf)於1949年發表的實驗定律。它可以表述為:在自然語言的語料庫里,一個單詞出現的頻率與它在頻率表裡的排名成反比。

所以,頻率最高的單詞出現的頻率大約是出現頻率第二位的單詞的2倍,而出現頻率第二位的單詞則是出現頻率第四位的單詞的2倍。這個定律被視作任何與冪定律概率分布有關機制的參考

橫縱坐標均為對數比例下,齊夫定律的概率質量函數的圖像,其中N = 10。橫坐標是指數k 。(注意,函數僅在k為整數時有定義,圖上的連線不代表函數連續。)

其他形式(Variants)

分段冪律(Broken Power law)

初始質量函數的一些模型遵循分段冪律; Kroupa(2001)紅色

分段冪律是一個分段函數,由兩個或多個的冪律函數組成,再加上一個閾值。例如,有兩個冪律:

具有指數截止的冪律分布(Power law with exponential cutoff)

具有指數截止的冪律就是冪律乘以一個指數函數:

曲線冪律(Curved power law)

來源:集智百科

地址:wiki.swarma.net/index.p

推薦閱讀

解讀冪律分布與無標度網路

複雜系統入門必修課——冪律分布

社交網路中的冪律分布

點擊「編輯」,做些改變,按下「保存」,你將影響世界!

推薦課程

campus.swarma.org/gpac= (二維碼自動識別)


集智俱樂部QQ群|877391004

商務合作及投稿轉載|[email protected]

◆ ◆ ◆

搜索公眾號:集智俱樂部

加入「沒有圍牆的研究所」

讓蘋果砸得更猛烈些吧!

推薦閱讀:

查看原文 >>
相关文章