昨天我們考察了bioplex網路的某些總體性質,但是我們對於局部的性質仍然不了解,而對於ppi interactome來說我們事實上對局部性質更感興趣。因而這裡我們使用一個簡單的聚類方法,2012年發表的ClusterONE[1],來抽取這一網路中的高聚類係數的子集。

ClusterONE跟k-means類似,從一些核心往外延伸聚類,只不過空間里的點換成了圖上的節點。這一演算法原本的目的是用來從interactome中發現complex。理論上一個complex對應於一個interactome中的clique(某種意義上complexome應該用一個hypergraph[2]表示,不過可能因為處理上的困難現在很少見到用這種表示的,而且不一定適用於ppi的情形(?)),但是因為實驗方法的問題事實上我們需要假設有一些存在但是沒有檢出的interactions(應該說檢出的interaction事實上只是總的interaction的冰山一角),為此ClusterONE中還引入了一個補償項(註:應該注意到一個interactome的clique也不一定代表一個complex)。這個演算法有另外一個特性是聚類之間允許重疊,這樣就更加貼近complexome實際的表示。

考慮到在網路中越大的聚類被錯判為complex(就是實際上並不包含某個complex)的可能性越小,我們乾脆就只考慮10個節點以上的聚類。為了減少其它節點的干擾,迭代數次刪除非聚類的節點,最終可以得到63個有重複聚類,這些聚類的尺寸在47節點以下"均勻分布"。

考慮到剩下的這些聚類依然形成一個大的連通分支(根據無標度網路的特性,在刪除一些節點之後無標度性質仍然會保留),那麼這一個"聚類網路"或許具有某些有趣的性質。至少來說,聚團與聚團之間的關係可能仍然保留small world的性質(但是事實上有一些偏離)。首先:

度數分布的"分段更嚴重"了。雖然說>10部分的最小二乘直線斜率並沒有太大改變,但是對於小度數節點(1-5)的度數分布斜率是相反的(可能這跟聚類的選擇有關?)。

和處理前的bioplex整體不同的是,在這一"聚類網路"中的平均聚類係數分布更接近power-law關係(R^2=0.830)。這意味著這個子集具有更明顯的hierarchial特性[3]。

不過這種說法事實上是有問題的。因為事實上如果考慮到事實上形成的complex的話,並沒有真正意義上的hierarchy存在(從另一個層面上講並沒有真正的hub存在),或者說這種hierarchy並不具有其它的scale-free network的特性。事實上度數分布和scale-free網路的關係也是可疑的。比方說如果我們有一系列的大小以power-law分布的clique(對應於一系列的protein complex),那麼我們也有可能得到一個度數的power-law分布,但是這個網路並不是一個scale-free網路。從另一個角度考慮如果我們從一系列的給定的clique出發來構造網路的話,那麼我們的度數分布也不會是power-law的。這說明我們的聚類網路裡面隱藏著許多小的"中間結構",這些中間結構是scale-free網路的特性所決定的,而即使生物學上complex的形成是受到進化約束的,總體ppi網路結構卻是不變的。這個問題也許需要進一步的詮釋。

Refs.

[1] Nepusz, T., Yu, H., and Paccanaro, A. (2012). Detecting overlapping protein complexes in protein-protein interaction networks. Nat. Methods 9: 471–472.

[2] Patro R., Kingsoford C. (2013). Predicting protein interactions via parsimonious network history inference. Bioinformatics 10-11: 237–246.

[3] Dorogovtsev SN et al. Pseudofractal scale-free web. Phys Rev E 65:066122.

推薦閱讀:

相关文章