參考: rosettacommons.org/docs

教程資源: 位於$ROSETTA3/demos/public/vip 注意: demo中的結果格式已經過時,以本文實際測試結果為準。

注意: demo中的flag比較詭異,以本文實際測試結果為準。

前言

RosettaVIP最早是為瞭解決人工設計蛋白不穩定的問題而開發的,RosettaVIP使用RosettaHoles的方法來發現蛋白質結構中摺疊不合理的疏水空隙,並搜索合適的氨基酸來替代,使得蛋白核心摺疊更加穩定。

演算法原理:

RosettaVIP設計是通過不斷迭代以下3個步驟實現:

  • 使用RosettaHoles搜索蛋白內部中的疏水空隙,並確定該空隙周圍的氨基酸組成;
  • 將這些氨基酸單點突變為疏水氨基酸(Fixed Backbone Design);
  • 將本輪具潛力的一些點突變進一步進行Relax優化的結構,計算單點突變的ddG值,並從這些點突變中選擇最好的,在此突變的基礎上進行下一輪迭代。

以上的迭代持續進行,直到找不到空隙,或沒有更好點突變位點為止。

設計效果:

參考Automated selection of stabilizing mutations in designed and natural proteins一文

Benjamin 通過RosettaVIP演算法對數據集測試: 結果顯示演算法相比於RosettaDesign演算法可以更加準確地識別蛋白疏水內核的穩定型殘基。並以人工重新設計的λ受體蛋白DNA結合結構域、Protein L進行內核優化,試驗驗證結果提示RosettaVIP均能解決重設計蛋白不穩定性的問題。

此外,他們團隊也嘗試將RosettaVIP應用於天然蛋白的設計,以eMAP為例,通過設計獲得了含5個點突變的eMAP5,其Tm值提升17.6℃。並且經過回復突變驗證,這5個點突變只有組合在一起時,才能起到強大的組合效應。

1 準備輸入文件

準備RosettaVIP的運行參數文件flags, 內容如下:

# 採樣參數控制:
-s Start_Lambda_Model.pdb # 定義輸入的結構
-ignore_unrecognized_res # 刪除多餘的無法識別的殘基 以及 水分子
-cp:ncycles 4 # 控制迭代次數(不推薦使用)。
-cp:cutoff 6.0 # 定義可突變鄰近氨基酸範圍,文獻值為7.0
-cp:max_failures 1 # 代表一次命令運行中,如果出現了x次錯誤,才會退出程序,設置為5次,可以確保RosettaHoles找到空隙。
-sasa_calculator_probe_radius 1.0 # 表面探針

# 控制側鏈優化:
-cp:pack_sfxn ref2015 # 設置打分函數
-cp:exclude_file $filename # 允許定義不可突變的關鍵氨基酸

# relax優化控制
-cp:relax_sfxn ref2015 # 設置relax的打分函數
#-cp:skip_relax # 跳過relax階段,只生成用於構建突變庫的列表
-cp:relax_mover "relax" # 默認relax,可選"classic_relax",但是更慢
#-cp:local_relax # 是否只進行局部relax的範圍。針對大體系時啟用,或對PDB結構進行截短處理,無關緊要的部分不考慮。demo中啟用後,點突變尋找的能力下降,經常是失敗的**。

# 報告輸出
-cp:print_reports # 將生成 reports.txt報告文件。
-cp:print_intermediate_pdbs # 輸出每一步的中間體蛋白PDB文件

exclude_file格式: 每行定義一個氨基酸(pdb number)。

  • 如: 不允許A鏈128,136號計算突變:

128 A
136 A

寫好之後,將文件的全名替換掉-cp:exclude_file後面的$filename即可。

2 運行RosettaVIP

demo以λ受體為例,測試RosettaVIP。

# 切換到工作目錄
cd $ROSETTA/demos/public/vip/rosetta_inputs

# 直接運行
vip.mpi.macosclangrelease @flags

3 結果分析

運行結果輸出至reports.txt文件:

可見,RosettaVIP對於我們輸入的PDB結構總共進行了多輪迭代: 其中每輪都列出了候選的突變類型以及ddEgoe值(一種簡化的能量函數打分值,可粗略地判斷突變對穩定性的影響)

第一輪Relax後,程序分析出了10、13、35、52、57、60、66、71位點突變對結構穩定性有提升。而L13I的穩定性提升更明顯(ddEgoe:-4.6042),選取了該突變。

第二輪迭代篩選時是在L13I突變的基礎上重新分析能夠減少疏水空隙的點突變,新的結構基礎上,突變的位置,以及能量貢獻都發生了變化。

如此類推RosettaVIP模擬了"單點組合突變"的實驗過程。

Iteration 1 : Found candidate mutations:
Position: 10 Native AA: ALA Mutant AA: LEU ddEgoe: -8.60701
Position: 13 Native AA: LEU Mutant AA: ILE ddEgoe: -1.75332
Position: 17 Native AA: PHE Mutant AA: ILE ddEgoe: -5.2701
Position: 31 Native AA: VAL Mutant AA: ILE ddEgoe: -1.65599
Position: 35 Native AA: ILE Mutant AA: LEU ddEgoe: -3.73465
Position: 42 Native AA: PHE Mutant AA: ILE ddEgoe: -7.19784
Position: 52 Native AA: PRO Mutant AA: LEU ddEgoe: -1.66479
Position: 57 Native AA: ALA Mutant AA: VAL ddEgoe: -5.48826
Position: 60 Native AA: PHE Mutant AA: ILE ddEgoe: -6.92573
Position: 61 Native AA: ALA Mutant AA: ILE ddEgoe: -5.89349
Position: 64 Native AA: PHE Mutant AA: MET ddEgoe: -9.8102
Position: 66 Native AA: VAL Mutant AA: ILE ddEgoe: -1.52301
Position: 68 Native AA: ILE Mutant AA: LEU ddEgoe: -1.13047
Position: 71 Native AA: PHE Mutant AA: TRP ddEgoe: -5.02144
Iteration 1 : The following mutations were accomodated after relaxation:
Position: 10 chain: 3 Native AA: ALA Mutant AA: LEU ddEgoe: -3.07001
Position: 13 chain: 3 Native AA: LEU Mutant AA: ILE ddEgoe: -4.6042
Position: 35 chain: 3 Native AA: ILE Mutant AA: LEU ddEgoe: -1.76918
Position: 52 chain: 3 Native AA: PRO Mutant AA: LEU ddEgoe: -1.53427
Position: 57 chain: 3 Native AA: ALA Mutant AA: VAL ddEgoe: -0.947129
Position: 60 chain: 3 Native AA: PHE Mutant AA: ILE ddEgoe: -2.34727
Position: 66 chain: 3 Native AA: VAL Mutant AA: ILE ddEgoe: -1.05786
Position: 71 chain: 3 Native AA: PHE Mutant AA: TRP ddEgoe: -3.56223
Accepted mutation from LEU to ILE at position 13 chain: 3
Iteration 2 : Found candidate mutations:
Position: 8 Native AA: ALA Mutant AA: ILE ddEgoe: -2.1497
Position: 10 Native AA: ALA Mutant AA: LEU ddEgoe: -8.0779
Position: 17 Native AA: PHE Mutant AA: ILE ddEgoe: -5.2137
Position: 31 Native AA: VAL Mutant AA: ILE ddEgoe: -1.65536
Position: 32 Native AA: ALA Mutant AA: MET ddEgoe: -4.9991
Position: 35 Native AA: ILE Mutant AA: LEU ddEgoe: -3.64756
Position: 42 Native AA: PHE Mutant AA: ILE ddEgoe: -7.00559
Position: 52 Native AA: PRO Mutant AA: LEU ddEgoe: -1.8697
Position: 57 Native AA: ALA Mutant AA: ILE ddEgoe: -5.61317
Position: 60 Native AA: PHE Mutant AA: ILE ddEgoe: -4.88678
Position: 61 Native AA: ALA Mutant AA: ILE ddEgoe: -5.65812
Position: 64 Native AA: PHE Mutant AA: MET ddEgoe: -6.68818
Position: 66 Native AA: VAL Mutant AA: ILE ddEgoe: -1.49476
Position: 68 Native AA: ILE Mutant AA: LEU ddEgoe: -1.04628
Position: 71 Native AA: PHE Mutant AA: TRP ddEgoe: -4.97966
.......................
.......................

對比最終效果的展示: 經過VIP design, 內部的疏水空隙明顯減少。

特別注意事項:

  • 不要額外調用-ex1 -ex2選項,會大幅度下降計算速度。程序內部設計時已經考慮了額外的Rotamer;
  • RosettaVIP中relax是最耗時的部分,因此對大體系的計算能力不足,需要添加-cp:local_relax選項。
  • RosettaHoles1尋找疏水空隙是隨機演算法,如果只允許一次,有可能找不到應有的空隙,因此需要多跑幾次計算,可以嘗試增加-cp:max_failures的參數值。多次計算結果,會輸出多條不一樣的序列。
  • 點突變的假陽率大約在25%左右。

備註: RosettaVIP在線伺服器:

rosie.graylab.jhu.edu/v


推薦閱讀:
相關文章