達爾文進化不僅僅是生物學的組織原理,而且是「物理定律」,是信息在複雜系統中組織的必然結果

作者:Philip Ball

來源:The Strange Inevitability of Evolution - Issue 20: Creativity - Nautilus

?自然界有創造力嗎? 你可以環目四顧,看看熱帶鳥精美的羽毛,千姿百態的葉子,微生物的精明策略,令人眼花繚亂的各種能夠攀登、爬行、飛行、游泳的生物。生命如此宏偉,如達爾文所說,「無盡之形最為美妙」。 這還不夠說服你嗎?

所有這一切,難道不是達爾文式進化的產物——進化這種無意識的機器,隨機變異並通過自然選擇篩選其結果? 嗯,不完全如此。達爾文的理論不能完全解釋為什麼自然擁有如此神奇、無盡的創造性,持有這一觀點的可不止是神創論者。 蘇黎世大學的進化生物學家Andreas Wagner認為:「達爾文的理論肯定是他所在時代最重要的智力成就,也許是所有時代最重要的智力成就。但他的理論無法解釋進化論上最大的謎團,甚至連接近解決也做不到。」

Wagner所指正是進化如何進行創新,「生物世界是如何創造的」。自然選擇提供了一種強大的方法來篩選不同的變異以有效地解決環境挑戰,但它不能解釋所有這些變異來自哪裡。 生物學家Hugo de Vries在1905年就指出,「自然選擇可以解釋適者生存,但它不能解釋適者是如何出現的。」在過去幾年裡,Wagner和其他一些人開始理解進化中創新的起源。他們的發現使我們不僅可以瞭解達爾文進化是如何運作的,也能瞭解它為什麼能夠運作,是什麼使其成為可能。

一個流行的誤解是,進化創造新事物僅僅需要一個基因的隨機突變,例如基因從一代複製到下一代時發生的一個錯誤。大多數類似突變的結果只會比之前更糟,突變的基因編碼的性狀對於生存不太有效,甚至可能是致命的;但在極罕見的情況下,某個突變的性狀將提升獲得者的生存能力,並將這種有益的突變傳播到廣大的人羣中去。

麻煩的是,性狀通常不會如此整齊地映射到基因上:它們來源於在複雜網路中調節彼此活動的不同基因間的相互作用,或「基因迴路」。儘管如此,你可能會認為,進化有很多時間,它會最終找到「好的」基因迴路。但是數學告訴我們並非如此。

舉例來說,進化發育生物學領域的發現告訴我們,許多複雜生物體(包括我們)的不同身體設計不是來自不同的基因,而是來自不同的基因網路在相同的基本迴路(即Hox基因迴路)中的相互作用和表達。要從蛇到人,你需要的不是一組完全不同的基因,而只是在基本相同的Hox基因迴路上的一個不同的布線模式。對於這兩種脊椎動物,在迴路中有大約40個基因。如果你考慮到這些基因可能彼此調節的不同方式(例如激活或抑制),你會發現可能的迴路數量超過10的700次方。這是個很大的數,比可觀測的宇宙中基本粒子的數量還多。那麼,通過「盲目」進化找到可行的「蛇」或「人類」的性狀(或表現型)的Hox基因迴路,其幾率是多少?進化到底是如何通過重塑寒武紀魚類的Hox網路將我們創造出來的?

你擁有的單個基因可能並不重要,重要的是它們所在基因網路的屬性。

除了多如恆河沙數的基因迴路外,進化要進行創新還必須通過其他龐大得讓人難以置信的地貌。 同樣的問題也適用於代謝網路。生物體必須從其能找到的燃料處獲取能量,例如微生物的代謝在葡萄糖、乙醇或檸檬酸鹽等化合物上進行。在理想的情況下,它們的酶代謝機制將不僅僅是其中的一種,這樣能夠有更多的生存選擇。 但是,要適應其他的燃料談何容易? 即使對於種類相對較少的常見代謝燃料來說,這種可能的代謝機制的數量也是個天文數字。

類似的爆炸性的組合選擇數量同樣出現在蛋白質上。蛋白質是由數十至數百個氨基酸組成的分子,氨基酸被鏈接在一起並摺疊成特定的分子形狀。 在天然蛋白質中有20種不同的氨基酸,對於僅有100個氨基酸長度的小型蛋白質來說,排列組合的數目是10的130次方。然而,到目前為止的40億年的進化只提供了足夠的時間來產生約10的50次方種不同的蛋白質。那麼,進化是如何找到這些能夠運作的蛋白質的?

最後還有RNA。這種分子曾被認為僅僅是一種中介,能將基因中的化學結構單元(即鹼基對)序列轉換為催化生化反應的蛋白質中的氨基酸序列,現在則被認為有更多的功用。一方面,因為RNA分子既可以通過將信息編碼為序列來模擬基因,也可以摺疊成各種形狀充當化學催化劑從而模擬蛋白質,RNA是策動早期生命的最佳候選者。更重要的是,我們現在知道,RNA分子是基因活動的重要調節因子:一些基因通過它們編碼的RNA分子與其它基因相互作用,RNA可以作為開關將其它基因的表達上調或下調。 然而,RNA的進化創新同樣面臨著數量巨大到荒誕的組合選擇。

所有這些情況面臨的是同樣的問題。達爾文進化論和遺傳學的現代綜合取得了巨大的成功,但正如瓦格納所說,這一成功背後有一個「骯髒的祕密」。 如果進化缺乏手段去探索數量巨大的組合選擇,即時僅僅是其中的一小部分,那麼又是如何找到可行的解決方案的呢?從現有的解決方案出發,進化是如何找到通往可行的新解決方案的路徑,它是如何創造的? 答案至少在一定程度上是非常簡單的:這比看起來容易。進化過程所探索的組合選擇有一個非凡的結構,而達爾文以及將達爾文主義與遺傳學相結合的傳承者都沒有預料到這一點。

撒下千億張網路

奧地利科學家Peter Schuster是最早探索進化如何創造的人之一(他是那種只能稱之為「科學家」的學者,因為無法判定他是一個物理學家、化學家還是生物學家)。因為對生命從開始的可能性感興趣(所謂的RNA世界),從20世紀70年代起,舒斯特開始探索RNA可以做什麼。RNA分子需要摺疊成正確的形狀才能成為催化劑;與蛋白質一樣,該形狀由分子的結構單元序列決定。實際上,這是一個基因型到表現型的問題,基因型是RNA的序列,表現型則是摺疊形狀。表現型決定了有機體對其環境的適應能力,選擇由此發生並最終被記錄在基因型中,基因則將此性狀繼續傳遞給後代。但是,表現型和基因型之間的關係仍有許多奧祕。可以說,這是我們所謂後基因組時代的最大謎團:要找到多種遺傳的表現型在基因型中的編碼是極端困難的。

20世紀90年代,舒斯特和他的同事設計了一個計算機程序,可以從序列中預測RNA形狀最簡單的特徵(它的二級結構,即鏈的一部分如何通過鹼基配對與其他部分相連)。對於100個鹼基的RNA,有大約10的23次方種可能的形狀。但是,值得注意的是這些形狀與其序列的相關性。

你可能會天真的期望具有相似形狀(即表現型)的RNA會有相似的序列,因此一張包含所有可能序列的地圖將被分成各種形狀的「王國」;這張「地圖」是一個多維的序列空間,其中的每個網格點對應一個特定的序列。但舒斯特的發現並非如此。RNA可以有相同的形狀和完全不同的序列:你可以從不同的序列獲得完全相同的形狀和相同的催化功能。但是這些表現型「兄弟」在序列空間的分佈卻並不是完全相互隔離的。相反,具有相同形狀的RNA在一張互相關聯、並最終遍佈整個序列空間的網路中。你可以通過對序列進行一系列小的改變從一個序列跳到另一個序列,但形狀和功能保持不變,就像逐站通過鐵路網線一樣。這種變化稱為中性突變,因為它們對適應度既不是有益的也不是有害的。事實上??,許多突變即時不是嚴格中性而是略微降低適合度的,仍可如準中性的突變般在羣體中維持很長時間。

以上就是所有10的23次方種可能形狀的情況。換句話說,這個RNA序列空間由10的23次方個網路交織而成,這些網路是聯鎖的但很少相交。 這意味著,高維空間中特定點處的任何給定序列都有大量形狀不同的相鄰序列,但只要沿著正確的軌跡前進,這一序列就可以一步步變異為形狀類似的不同序列。

現在我們知道了關於RNA序列空間的兩個關鍵之處。首先,有許多、許多可能的序列能夠產生相同的功能。如果進化是通過自然選擇「搜索」該功能,那麼會有很多可行的解決方案可供選擇。其次,上述序列空間雖然是多維的且無比廣闊,但的確是可以通過的:你可以在不丟失所有重要的表現型的情況下中性的改變基因型。這就是為什麼RNA是可演化的:不是因為進化有足夠的時間篩選大量的變異來找到可行的變異,而是因為有很多可行且互相關聯的變異。

西班牙國家生物技術中心的Susanna Manrubia對RNA序列如何決定二級結構進行了更複雜的計算研究,結果證明在基因型-表現型的映射空間中有的確很多冗餘。她認為,RNA這一特徵可能對其在生命起源中所起的作用至關重要。「存在多種基因型的解決方案對於RNA世界的出現可能是必不可少的,」她說。

蛋白質同樣擁有這一屬性。不同的生物體經常擁有具有相同形狀和酶功能(表現型)的蛋白質,但通常組成這些蛋白質的氨基酸僅有不超過20%是相同的。馬裏蘭州國家衛生研究所的David Lipman和W. John Wilbur 1991年用一個簡單的蛋白質結構模型展示了為什麼會這樣:他們的簡化模型蛋白質對應序列空間中的網路,可被中性突變一步一步遍歷。2001年,哈佛大學的Anthony Keefe和Jack Szostak用實驗證明,蛋白質序列和表現型之間存在的明顯的冗餘。他們開始尋找由氨基酸隨機組成、可結合ATP這種小分子的蛋白質,ATP是活細胞關鍵的能量儲存分子。幾乎所有有用的蛋白質都使用ATP作為能源。因此ATP結合物是細胞的重要組成部分。Szostak和Keefe使用化學方法隨機合成了大量有80個氨基酸的蛋白質,然後從中篩選恰好能結合ATP的變體。當然,他們無法將上述氨基酸的所有可能組合全部合成出來,但他們在其合成的一小部分樣本(6萬億)中,即發現了四種ATP結合物。四個聽起來並不是很多,但是,考慮到這僅僅是相對整個序列空間極小的一個樣本,那麼在其餘的序列空間中必然有大量的ATP結合物——研究人員估計大約有10的93次方個。

這表明,可進化性是生物學中及其他複雜網路的一個基本特徵。

Wagner和他的同事發現,這種「可進化的」(他們稱之為「有系統彈性的」)結構是生物複雜性的共同特徵。2006年,Wagner和他的博士後Jo?o Rodrigues開始研究大腸桿菌的代謝網路。大腸桿菌可能是所有細菌中被研究得最多的一種,其代謝的生化途徑早已被學界熟知。大腸桿菌分解葡萄糖,並從其中合成自身生存需要的60個關鍵分子結構單元。但是,如果其中的一個代謝反應改變了,這些大腸桿菌的「鄰居」是否仍可依靠葡萄糖生存嗎?這樣的鄰居有很多,但Wagner和Rodrigues計算了超過1000種「鄰居」的代謝反應,發現其中幾百種仍可依靠葡萄糖生存。換句話說,大腸桿菌的代謝網路並非精準的為葡萄糖定製——許多其他變種也可以。研究者繼續搜索代謝網路的空間,探尋鄰居的鄰居是否也能依靠葡萄糖生存。他們發現,可以沿著這個葡萄糖代謝者網路一直變異下去,直到發現某種與大腸桿菌只有20%代謝反應相同的生物。與此前一樣,數量巨大的可能選擇都可以通過小步的中性步驟到達。進化將大量的生物送出去探索這個錯綜複雜的圖書館,尋求生命問題的最好回答。當Wagner偶然發現這種「代謝空間」意想不到的拓撲性質時,他幾乎欣喜若狂。

基因迴路同樣如此。Wagner與物理學家Olivier Martin合作,研究基因調控網路的可能空間。他們搜尋能夠生成同樣基因表達(即同樣的表現型)的不同基因調控網路;例如,在三個基因A,B 和C的網路中,通過A抑制B或C抑制B均可實現相同的結果,即關閉基因B的表達。即使只有僅僅十幾個基因,要窮盡相互作用網路的可能數量也會大得驚人,因此研究人員只能研究其中極小的一部分。但研究結果是明確的:一方面,基因迴路通常有幾十到幾百個具有相同表型的鄰居;另一方面,其構成90%都不一樣的迴路,仍然可以產生相同的基因表達模式。

這有助於解釋基因迴路一個令人困惑的特性——系統彈性。20世紀90年代末,斯坦福大學的一組研究人員創造了大約6,000個釀酒酵母的變體,每個都缺少一個不同的基因,卻發現其中許多變種能與未變異的酵母一樣正常生存。其他生物同樣如此:很多基因即使完全去掉,也對生物體沒有明顯影響;大量類似的基因迴路可以完成與原始迴路同樣的工作。系統彈性是創新的補充:可以在大量替代品中進化出新特徵和形式的基因網路,必須對細小的變化有強大的系統彈性,因為幾乎肯定有替代品可以實現同樣的功能。對於基因決定論,這是一劑解毒藥:你有哪些基因可能並不重要,是基因網路而非單個基因在發揮作用。

巴塞羅那基因組調控研究中心的Johannes Jaeger認為,Wagner的工作是「真正的創新,非常重要。」 他正在研究控制果蠅等昆蟲生長的基因網路的進化和發育,試圖驗證這些想法。 「到目前為止,我們的結果與Andreas的見解一致,」Jaeger說。 他們發現,不需要批量的重組基因,只需要調整一些基因調控機制,就可輕易的在按順序還是同時形成蠅身節段之間切換。 「這解釋了不同果蠅種類中基因表達模式的差異,」Jaeger說。 「不同的模式可以由同一組基因產生。」

進化是自然法則嗎?

相對於造就生物系統的進化過程,這些發現揭示了生物系統一個更底層的屬性,即進化是在什麼樣的地貌上造就生物系統的。進化之所以可能,是因為上述地貌具有特定的拓撲性質,無論是基因、代謝物、蛋白質亦或核酸序列,其功能性類似的組合相互連接成巨大的網路覆蓋整個多維空間。

人們可能會認為,生命世界最初的創造是合成生命的組件:氨基酸和糖等組成生命分子的化學成分。但事實上這種創造是很容易的,只要有合適的原材料和環境再加上一點運氣可以做到。更難的問題是,生命是如何超越被動的原始湯,開始達爾文式進化的? Manrubia認為,這個原初的創造性一躍可能來自複雜巨大的中性(或準中性)網路。這意味著,即使對於隨機、非生物生成的RNA序列,仍有很大的機會找到一些能夠實現有用功能的序列。 「在某種意義上,如果表現型在序列空間中有足夠多的體現,你就有了免費的功能,」Manrubia說。她的計算機模擬顯示這樣的RNA序列並不罕見。 「在沒有進化過程本身的情況下,可能會出現足夠好的解決方案作為進化過程的種子。」尤為可能的是,會出現可以自我複製的序列,然後進化程序就開始運行了。 「自然選擇可以很快地把平庸的解決方案變成完全適應性的解決方案,」Manrubia說。

這表明,可進化性和對創新的開放性不僅是生命的特徵,而且是信息本身的特徵。

生物分子組合的這種結構使自然能夠大膽的進行創新,而不是永遠圍繞現存的進行增量變化。進化只需沿著中性(或準中性)的突變網路隨機遊走,就可以在不損害生物適應性的情況下,針對環境造就的選擇壓力得到創新的解決方案。 通過這種中性漂移,生物體可以到達相位空間中的某些位置,而從原始起始位置進行嚴格的適應性突變卻無法達到這樣的位置。

長期以來,前述隨機漂移在進化中的作用一直受到認可。進化生物學家John Tyler Bonner最近提出,隨機漂移可能比之前認為的更為重要,尤其是對於硅藻、放射蟲等微小的海洋生物來說,這些海洋生物極其多樣化的形狀和結構並不一定是適應環境的結果。這些極富創造性和藝術性的形態不單令生物學家驚訝,還啟發了不少藝術家的靈感。現在看來,我們可以理解這種多樣性和創造性來自何處。

更重要的是,Wagner及其他人提供的新觀點可以解決一個長期存在的爭論,即羣體適應性與個體適應性之間明顯存在的衝突。鑒於大多數突變會降低適應性,一些細菌產生的突變數量似乎對於個體適應性來說過多了。 一個流於簡單化的解釋是,許多突變對整個羣體都有好處,因為它們為適應新的環境挑戰提供了更多的選擇。 但是,在擁有系統彈性的網路上產生的突變更有可能是中性的,這既對個體有利(因為產生有害突變的機會較小)也對羣體有利(因為它能在需要時提供新的適應方式)。

那麼,為什麼進化選擇的空間擁有這一具備系統彈性的結構? 「我們就是不知道為什麼基因型的網路是以這樣的方式交織的,」Wagner承認。西雅圖Fred Hutchinson癌症研究中心的Jesse Bloom是蛋白質進化的專家,他認為這個問題可能得反過來看:「我們可以認為,只有當這種特性存在時進化纔能有效地運作,因此能夠進化的就都擁有這一特性,「Bloom說。但他承認,這將很難得到證明。

然而,上述答案可能超出了生物學的範疇。 Karthik Raman是Wagner實驗室的前博士後,現在在印度理工學院馬德拉斯分校工作,他在電子元件領域研究了類似的問題;對執行二進位邏輯功能的電子元件來說,某些不同的電路能產生相同的二進位邏輯功能,與基因類似。Raman將有16個組件的電路隨機重新布線,並試圖確定哪些組件會執行特定的邏輯操作,Raman發現,電路也具有這種可演化的拓撲結構。但是關鍵在於,只有當電路足夠複雜時,這一屬性才會出現——如果組件太少 ,很小的變化就能破壞了其功能。 「電路越複雜,能承受的重新布線越多,」Wagner說。這不僅開啟了使用達爾文原理進行電子電路設計的可能性,而且表明,與生物學的發現一致,可進化性是複雜網路的一個基本特徵。

Manrubia也同意複雜性是關鍵所在: 「很明顯,可進化性只能在高維的基因型空間中實現。」 有更多的方向,就能達到更多的選擇。「隨著序列的鄰居數量增加,某些鄰居能提供可行解決方案的可能性也會增長。」因此,對於生活在不同環境的生物來說,更大的基因組將更有利於產生適應性的變異;更大的基因組雖然需要耗費成本複製和保持大量的DNA,但從系統彈性中獲得的收益更多。

諾貝爾獎獲主化學家Manfred Eigen是舒斯特的合作者,他長期以來一直認為,可進化性和對創新的開放性不僅是生命的特徵,而且是信息本身的特徵。他認定,達爾文進化不僅僅是生物學的組織原理,而且是「物理定律」,是信息在複雜系統中組織的必然結果。如果這是正確的,那麼生命的出現可能不是一個奇蹟般的機會恩賜,而幾乎是數學的必然性。


推薦閱讀:
相關文章