如何在CDS序列中選出植物中定量非同源性基因序列?
找的基因中的序列同源性太高,無法做定量表達,希望能從cds中高效選出同源性比較低的序列從而設計引物,跑熒光定量。
謝邀 @范甘迪亞 。恕我直言,這個問題的題目和附加描述就不是中國話。
「選出植物中定量非同源性基因序列」,我不知道從哪斷句。
建議使用規範的科學用語、正確的語法,重寫問題。我反正是沒看懂這是問的什麼。
我就假設你的問題是「對兩個同源性很高的序列模板,如何設計引物,使得引物只特異性地擴增其中的一個」吧。
系統一點的辦法,用打包好的演算法 PRIMEGENSw3,原理看這篇文獻:
Homolog-specific PCR primer design for profiling splice variants?www.ncbi.nlm.nih.gov
自己手動設計,拿兩段序列做個alignment,然後找不同。有的可能是一個鹼基不同,有的可能是連續的7-8個鹼基不同,找一段比較長的變異位點,作為引物結合位點的3』端,然後就按正常的設計引物的要求往前捯。
只要引物3端的3-5個鹼基是不同的,就能區分兩個模板。
你要是兩段序列之間,連續3個鹼基不同的區域都找不著,那就根本做不了PCR,換別的方法。
看了半天似乎看懂了:題主好像是想要避免序列太像以至於引物特異性不好。
這個是比較困難的,因為引物自己也對序列有一些需求,比如沒有發卡結構、退火溫度要合適,滿足了引物需求就可能滿足不了特異性需求。
你也許可以這樣試試:
- 稍微降低一些引物自己的要求,比如GC含量什麼的,看看能不能找到特異性更好的位置。
- 既然CDS自己特別像,那能不能在CDS的外面設計引物?外圍序列會不會差別更大?
我自己不做實驗,這些只是一些通用經驗。
import AlignIO from bio
for everyOneAlignment in AlignIO.parse(yourAlignmentData):
tmp = getEvery50bpAndCheckTheSimilarity(everyOneALignment)
if tmp is whatYouWanted: output
else: pass
大致這麼個偽碼吧。。
做多重序列比對呢?
推薦閱讀: