最簡單的網路模型是隨即圖,在這種模型中,無向邊被隨機分配到 n 個頂點之間, frac{1}{2}n(n-1) 條邊中的每一條邊都會以相同的概率 p 出現,每個頂點的連邊數服從泊松分佈。隨即圖被數學家們廣泛研究,形成了一系列成果。很多真實網路有趣的特徵近年來吸引了大量的研究者,但是這些特徵與隨機網路中的又大不相同。真實網路在某些方面的不隨機性表明可能存在指導網路形成的機制和能通過研究網路結構來實現某一目標的方法。

  • 小世界特性

在20世紀60年代Stanley Milgram的社會學實驗中,只需通過六個人就能夠將一封信送至目標個體。該結果是第一個對小世界效用的直接證明,事實上,大多數網路中兩個節點間的路徑都很短。在Milgram之前的1929年,匈牙利作家Frigyes Karinthy在一篇小說中就推測存在小世界效應,更嚴格的證明是由Pool和Kochen給出的,儘管發表在Milgram的研究之後,但是他們十年前就在預印版中提出了該問題。如今,小世界效應已經在大量的不同的網路中得到了證實。

現在考慮一個無向網路,定義 l 為節點對之間的平均最短路徑,那麼  l=frac{1}{frac{1}{2}n(n+1)}sum_{igeq j}{d_{ij}}

d_{ij} 是節點 i 到節點 j 的距離,如果兩個頂點不可達,則把距離定義為無限遠。

上述公式包含了節點到自身的路徑長度(路徑長為0)。在一個有 n 個頂點和 m 條邊的網路中,可以用廣度優先遍歷(也叫「燃燒演算法」)在 O(mn) 時間內得到。小世界效應對發生在網路上的動態過程有明顯的影響。例如,一個人想在網路上傳播一條信息,由「六度分離」理論可知在大多數網路上這種效應會加快傳播,尤其是謠言。小世界效應會影響網際網路上的中繼器的數量,旅行者的航班數和疾病在人羣中傳播的時間等等,這種效應也會影響室內遊戲,尤其是計算「Erdos數」和「Bacon數」。

另一方面,小世界效應在數學上也是顯而易見的。如果距中心點距離小於 r 的節點數以指數 r 增長,那麼 l 就以 log(n) 增長。近年來,小世界效應的定義變得越來越準確:如果說一個網路具有小世界效應,那麼 l 的值相對於網路規模應該是對數尺度(對於一個固定平均度的網路)。有一些網路的l值增長的甚至比 log(n) 還慢。Bollobas和Riordan證明瞭在power-law網路中, 的增長不會快於log n /loglogn ,並且Cohen和Havlin討論了真實情況或許比這還慢。

  • 聚集性

與隨機網路不同的是,在許多網路中,如果節點A和B相連,B和C相連,那麼A和C也很有可能相連,也即,你朋友的朋友也是你的朋友。聚集係數就是來衡量這種可能性大小的一個指標,聚集係數可以衡量一個網路,也可以衡量網路中的一個節點。

C=frac{3	imes number of triangles in the network}{number of connected triples of vertices}

C_{i}=frac{number of triangles connected to vertex i}{number of triples centered on vertex i} Dorogovtsev, Goltsev,Mendes和Szabo,Alava,Kertesz兩組人發現在scale-free網路中, C_{i} 正比於 k_{i}^{-1} ,其中 k_{i} 是節點i的度。類似的特徵在真實網路中也得到了證。

聚集係數是衡量一個網路中三角形的密集程度的,也可以將它推廣到長度為4或5的圈。

  • 度分佈

節點的度是其上的連邊數,定義 p_{k} 為網路中度為k的節點的比例,也即在網路中隨機選擇一條邊,其度為k的概率是 p_{k} .在隨機圖中,節點的度服從泊松分佈,但是真實網路的分佈卻不是這樣。大多數真實網路的度分佈會向右偏移,出現長尾效應。

量化這個長尾需要一些技巧,儘管理論上可以畫出度分佈的直方圖,但是實際上極少有能很好統計長尾的指標,並且,直接畫出的直方圖中包含大量的噪音。有兩種方法可以解決該問題:一種是,每隔指數間隔大小統計一下度分佈(節點度之和除以間隔大小),這種統計方法一般用在對數坐標中,因為間隔越來越大,統計問題也隨之減小;另一種是用累計分佈函數,

P_{k}=sum_{k^{}=k}^{infty}{p_{k^{}}}

表示度大於或等於k的概率之和。這種方法能夠保證所有的數據都能展現出來,並且消除了不同數據點落到同一間隔的問題。累計分佈函數同樣能夠減少長尾處的噪音。在power-law網路中,度的累積分佈函數,

P_{k}simsum_{k^{}=k}^{infty}{k^{-alpha}}sim k^{-(alpha-1)}

對於其它類型的網路,度分佈的情況要稍微複雜一些,例如,二部圖,兩類節點都有各自的度分佈。還有在有向圖中,有入度分佈,出度分佈和二者的聯合分佈.

a. Scale-Free網路

Power-law網路有時也叫scale-free網路,儘管只是它的度分佈服從scale-free。最早的scale-free網路可能是Price的科學論文引用網路,這個網路中的 alpha 介於2.5到3之間,在後來的一篇論文中,他指出了 alpha的精確值(3.04)。他還發現了這個網路中的出度服從power-law分佈。Power-law現象還廣泛存在於其他的引用網路、WWW網、網際網路、代謝網路、電話網路和人類的性關係網路中。

b.最大度

網路中節點的最大度一般依賴於網路的規模。給定一個特定的度分佈(假設所有的度都是獨立採樣的,真實網路並非如此),隨機選取m個度為k的頂點,網路中不存在比k更大的度的概率為,

h_{k}=sum_{m=1}^{n}{inom{n}{m}p_{k}^{m}(1-P_{k})^{n-m}}=(p_{k}+1-P_{k})^{n}-(1-P_{k})^{n}

那麼最大度的期望值為 k_{max}=sum_{k}{h_{k}}

對於很小或者很大的k, h_{k} 都會趨於0,因此 K_{max}由h_{k}的最大值決定
  • 網路彈性

與度分佈相關的另一個特性是在移除節點後網路的彈性。大多數網路的網路功能依賴於其連接性,即節點間是否可達。如果網路中的節點被移除後,那麼平均意義上而言,路徑長度會增加,最終節點間變得不可達。有一些不同的方式來移除節點,例如,可以在網路中隨機選點進行移除,或者移除一些特殊的點(比如最大度的點),不同的網路也具有不同的彈性。網路彈性在流行病學中具有特別重要的作用,例如移除某個節點意味著給個體接種疫苗,因為接種疫苗不僅意味著使該個體免於感染,同時也切斷了傳播路徑,這在公共健康方面有著重要作用。

Albert,Jeong和Barabasi研究了在兩個網路中——具有6000個自治系統的網際網路和具有326000個網頁的萬維網子網——刪除頂點後的影響。兩種網路都服從power-law分佈,然後他們測量在隨機刪點和刪除最大度的點後點對之間的平均路徑長度。

隨機刪點的方式並沒有使網路中點對間的平均路徑長度增加,但是按照節點最大度順序刪點的方式卻明顯增加了點對間的平均路徑長度。這也比較容易理解,以為網路中大多數點的度很小,隨機刪除一部分點並不會對網路結構造成太大的影響;另一方面,如果按照節點的度從大到小的順序刪點的話,點對間的平均路徑長度則會迅速增加。因此,無論是網際網路還是萬維網,對隨機的單點失效問題具有很高的彈性,但是對最大度點卻很脆弱。Broder等人獨立地發現了相似的結果,確有著完全相反的解釋。Broder等人獨立地發現了相似的結果,確有著完全相反的解釋。
  • 混合模式

節點間如何配對是網路結構更深層次的特性,大多數網路中有多種類型的節點,節點間的連接概率依賴於節點的類型。例如,在食物鏈網路中,節點代表植物、食草動物或食肉動物,植物和食草動物之間有很多連邊,而更多的邊出現在食草動物和食肉動物之間,但是食草動物間或者植物與食肉動物間很少有連邊。Maslov,Sneppen和Zaliznyak提出了在網際網路中存在三種類型的節點:運行主幹線的高級連接運營商、網際網路終端用戶和網際網路服務提供商(ISP)。同樣的,在用戶與ISP之間和ISP與運營商之間有很多連接,而ISP之間和運營商與用戶間則很少連接。

在社交網路中,這種選擇性的連邊模式叫做相稱混合性或者同質性,在流行病學中也存在這種現象。一個典型的例子就是混合的種族社交網路,如下圖所示,統計了舊金山1958對夫婦的種族,結果顯示,人們更傾向與自己相同種族的人結婚。

  • 度相關

網路中度大的節點是更傾向與度大的節點建立連接,還是與度小的呢?事實上,這兩種情況都有可能出現。有多種方法可以衡量度相關性,Malov等人在蛋白質網路和網際網路中用二維坐標來刻畫每條邊兩端的頂點的度,Pastor-Satorras等人提出了一種更為簡潔的方法,他們在網際網路中用節點鄰居的平均度來代表該節點的度,如果網路是同配的,那麼節點鄰居的平均度會隨著節點本身的度增加而增加。然而在網際網路中情況卻相反,我們稱之為非同配性。

Newman通過計算連邊兩端節點的Pearson相關係數進一步簡化了這種衡量,如果網路是同配的,那麼Pearson相關係數就是正的,反之則是負的。有趣的是,社交網路貌似是同配的,但是其他的網路(信息網路,技術網路,生物網路)確實非同配的。

  • 社團結構

大多數社交網路都會呈現「社團」現象——社團內的聯繫很緊密,社團間的聯繫很稀疏。3.5中的同配性或許可以解釋這種現象——相似年齡、興趣、經歷、社會地位的人更有可能發生聯繫。但是網路有可能是同配的但卻沒有表現出「社團」現象,例如年齡的同配網路,有這種結構的網路有時也被稱為分層的網路。

下圖表示美國學校中小孩的友誼關係。『

傳統的社團檢測方法是聚類分析,有時也叫層次聚類。可以通過多種不同連接強度的定義來實現聚類,例如「邊介數」。

  • 網路導航

正如Kleinberg2000年指出的,Stanley Milgram的小世界實驗一方面說明瞭在社交網路中兩個相距很遠的人也可通過很短的路徑聯繫在一起,而更重要的一點是,實驗中的普通人好像很擅長找出這條最短路徑。因為實驗中的人並不知道網路結構,大多數人只認識他們的朋友或者很少一部分人認識朋友的朋友。這表明網路結構中存在一種相當特殊的東西,如果能夠構建人工網路模擬小世界實驗,那麼就可以構建高效的資料庫結構和點對點傳輸。

  • 其他特性

除了上述的特性外,網路的最大連通分支也是一個很重要的特性。例如在網際網路中,最大連通分支代表能夠互相交流的最大比例,同時也可以衡量一個網路的效率。最大連通分支通常等價於圖論中的最大連通子圖。有時也會研究第二大連通分支,通常最大連通分支要比第二大的連通分支大得多。

此外,節點的中介中心性也是網路的一個特性,Goh等人發現許多網路中節點的介數服從power-law分佈。節點的介數有時也可以衡量網路的彈性。

推薦閱讀:

相關文章