圖源:Quanta Magazine

「即使對抗進化是一項不可逾越的任務,但至少我們可以嘗試預測進化如何「出招」,這可以使我們在進行設計時變得更加謹慎。」

作者:Dr. Tom Ellis 英國帝國理工學院

編譯:孟凡康(對原文有部分刪改)

原文標題:Predicting how evolution will beat us[1]

現有的大多數微生物生物技術均使用的是在特定和穩定環境中表徵充分的細胞。但即使在如此理想般般的條件下,我們也會擔心兩種進化的力量:突變 (Mutation) 和選擇 (Selection)。為什麼?因為他們始終在對抗我們工程化改造的系統,使我們我們引入細胞的新基因最終失去功能。同時這些突變體相比於其他細菌會具有更快的生長速度,最終在培養環境中佔據主導優勢。

然而,隨著我們在微生物分子生物學、生物技術以及基因組學領域的逐步發展,我認為我們很快就能夠對這兩種進化力量進行預測,並最終指導合成生物學的相關設計。

為了預測進化,最好的辦法是探索大腸桿菌在通過質粒引入外源基因之後,將最終如何被獲得失活突變的細胞競爭掉。基於質粒的基因表達方法廣泛應用於基礎研究和生物技術之中,是目前最常見的基因工程技術之一。但是與將基因整合到宿主基因組中相比,質粒表達顯得非常粗野並且容易出現問題,但目前來說,其仍然是蛋白質生產和生物合成代謝領域的首選方法。

用質粒轉化的大腸桿菌羣體通過進化使得異源基因的表達失活,迄今為止已經有了成千上萬的失敗案例,當然這只是有文獻記載的,還有無數文獻沒有記載的。這種進化過程發生的速度主要由兩種進化能力的強弱來決定:突變的概率和選擇的強度。

雖然預測可能的突變對於那些研究生物體和基因組進化的人來說聽起來像是一種幻想,但是當我們將預測對象縮小到了大腸桿菌質粒上的僅僅數千個鹼基上時似乎就不會那麼牽強了。大多數轉化有質粒的細胞喪失功能的主要原因主要在於質粒的突變而不是基因組突變。大量的研究結果表明生物技術中常用的質粒具有常見的突變形式。其中一種常見形式是質粒自身的基因重組,這種過程一次性可以刪除質粒的整個功能模塊(編者註:比如終止子的同源性導致基因重組)。另一種類型的突變是由轉座插入序列(IS)元件引起的,它們將自身插入到保守性較差的基因序列中。大腸桿菌具有多種不同特異性的IS元件。當細胞處於應激狀態時,它們會插入到特定的基因位點,破壞質粒的功能模塊。

過去十年中的兩項關鍵的合成生物學研究為我們提供了一些急需的有關逃逸突變的特徵數據。這些數據為我們揭示了導致負載質粒的大腸桿菌被淘汰的關鍵所在。Sleight等人使用模塊化DNA組裝技術構建了由不同啟動子、三種不同熒光蛋白、不同質粒相互組合的文庫,並將攜帶這些質粒的大腸桿菌在實驗室中傳代數天。隨著時間的推移,研究人員發現細菌的熒光會逐漸損失。通過傳統測序揭示這些突變體,研究人員發現重組介導的基因缺失是熒光損失的罪魁禍首。最近Rugbjerg等人使用下一代測序技術追蹤了大腸桿菌(質粒上包含有一個合成代謝通路)中喪失生產力的不同逃逸突變體。有趣的是,研究人員在宿主基因組上並沒有發現明顯的突變,而只在質粒上發現了逃逸突變(通常由IS元件引起),最終導致細菌產量下降和細胞生長速度加快。

為了幫助預測大腸桿菌中基於質粒的突變,Barrick實驗室在2015年設計了「進化失敗模式(EFM)計算器」 。這種易於使用的軟體工具通過分析質粒DNA序列文件,搜索每個質粒中多次出現的同源序列(這是重組介導的基因缺失發生的主要原因)和簡單的序列重複。基於這些參數,EFM計算器將給質粒提供相對不穩定性預測(RIP)評分:RIP越高,質粒突變的幾率越高。當前的EFM計算器版本並沒有考慮由IS元件引起的突變,但是通過進一步的工作,我們可以期待開發出新一代的EFM計算器囊括由IS元件引發的突變情形。如果質粒序列的複製突變率(即DNA複製的不準確性)也可以整合到到EFM計算器中,那麼我們最終將擁有一個預測質粒突變的完整預測工具。

進化失敗模式(EFM)計算器,鏈接:http://barricklab.org/django/efm/

當然,突變只是進化的兩種力量之一; 那麼選擇呢? 對於在成分明確且穩定的環境中生存的大腸桿菌羣體,選擇實際上等同於生長速率。如果一個細胞羣體生長速度比其他羣體慢,最終生長較慢的羣體將會被稀釋並從培養環境中基本消失。此羣體的消失速度與其生長速度相對有多慢成正比。含有質粒的細胞比其競爭對手生長更慢的主要原因在於負擔 (Burden),這是一個在合成生物學領域被長期談論的話題。

負擔產生主要有三種原因。

  • 首先,表達任何額外的RNA或蛋白質都會成為一種負擔,因為表達過程需要能量,分子機器(如核糖體)等多種細胞資源(表達負擔 Expression burden)
  • 其次,表達的RNA或蛋白質可能會消耗關鍵的細胞資源,例如本應用於合成宿主細胞自身代謝產物的酶(基於角色的負擔 Role-based burden)
  • 最後,RNA或蛋白質可能與細胞發生非預期的相互作用,最終損害細胞,例如表達的膜蛋白阻礙了宿主運輸通道或者表達的調控蛋白與基因組關鍵基因的調控序列發生非特異性結合(毒性負擔 Toxicity burden)

其中, 表達負擔相對來說是更加普遍的,並且最近的研究表明質粒在大腸桿菌中的表達負擔可能是相當大的。這意味著即使蛋白質在細胞內沒有任何破壞性,只是製造大量蛋白質的成本就會嚴重減緩細胞生長。

由於最近在合成生物學方面的工作,我們現在有了量化和預測基因表達負擔的方法,並且這些方法在估計基因質粒表達時大腸桿菌生長速率如何降低時表現非常出色。現在我們可以在任何克隆之前通過標準體外方法測量蛋白質編碼基因的表達負擔,然後將這些數據用於預測在細胞中生長速率降低的程度。由於生長速率是工業領域大腸桿菌的主要選擇壓力,因此這種預測方法能夠有效地確定外源基因(不具有顯著的基於角色或毒性負擔)所產生的選擇壓力。

所以也許現在是時候把這些努力整合在一起了。我們可以預測大腸桿菌中常見質粒的可能突變,我們可以預測基因所產生的選擇壓力。因此,當設計質粒時,我們可以製作突變的概率模型,並為每個突變減少負擔的程度進行打分。這個模型可用於估計哪個逃逸突變體可能在實驗中佔主導地位,以及需要多少小時或幾代才能實現。這不是一種確定性的預測,因為突變本質上是隨機發生的,但這在大量的大腸桿菌細胞羣體中會具有一定的統計意義。

我們也不應該忘記,質粒通常以多個拷貝的形式存在於每個細胞中,雖然這降低了雜訊,但多拷貝進一步增加了複雜性。當只有一小部分質粒突變時,細胞的生長速率如何變化?質粒分配在突變體繁殖過程中有多大的作用?要理解這些問題,我們當然需要處理更多數據。流式細胞儀、微流顯微鏡甚至單細胞測序都提供了可行的方法,這些技術使我們能夠看到突變如何在細胞中積累,這使我們能夠更好地預測這些突變如何在羣體中擴散。

擁有這樣的質粒進化預測工具可能對研究和生物技術都有廣泛的用途。在最初的情況下,它將使我們能夠更加真實地預測我們的基因工程設計能夠堅持多久; 對於高負擔質的情形,這可能不會超過一兩天。從一開始就瞭解這些限制將促進開發和採用替代的工程方法,如基因組整合外源基因表達序列或者採取反饋機制阻止毒性的過表達。

這樣的工具還可以預測長期使用工程化改造的細胞羣體中可能出現的突變體類型,例如當工程化改造的細菌需要定植在腸道微生物中長達數月。進化預測工具的另一個好處是它可以幫助揭示知識上的差距。在預測和實驗結果不匹配的情況下,通常有機會發現以前未考慮過的重要新機制。

最重要的是,質粒進化預測工具將允許那些設計質粒的人在實驗開始之前重新考慮不良設計。設計者可以儘可能降低表達水平,減少預期負擔,從而延遲突變失活的發生過程。他們還可以刪除或者優化最有可能產生突變的序列特徵。如果IS元件預計會成為突變的主要來源。設計者可以考慮將宿主更改為不含某些IS元件的宿主。

最後,成為更好的基因設計者是合成生物學家所追求的目標,即使對抗進化是一項不可逾越的任務,但至少我們可以嘗試預測進化如何「出招」,這可以使我們在進行設計時變得更加謹慎。

再創丨Regenesis讀者羣: 微信長按掃描二維碼備註「加羣」

參考

  1. ^https://onlinelibrary.wiley.com/doi/full/10.1111/1751-7915.13327

推薦閱讀:

相關文章