找的基因中的序列同源性太高,無法做定量表達,希望能從cds中高效選出同源性比較低的序列從而設計引物,跑熒光定量。


謝邀 @范甘迪亞 。恕我直言,這個問題的題目和附加描述就不是中國話。

「選出植物中定量非同源性基因序列」,我不知道從哪斷句。

建議使用規範的科學用語、正確的語法,重寫問題。我反正是沒看懂這是問的什麼。

我就假設你的問題是「對兩個同源性很高的序列模板,如何設計引物,使得引物只特異性地擴增其中的一個」吧。

系統一點的辦法,用打包好的演算法 PRIMEGENSw3,原理看這篇文獻:

Homolog-specific PCR primer design for profiling splice variants?

www.ncbi.nlm.nih.gov圖標

自己手動設計,拿兩段序列做個alignment,然後找不同。有的可能是一個鹼基不同,有的可能是連續的7-8個鹼基不同,找一段比較長的變異位點,作為引物結合位點的3』端,然後就按正常的設計引物的要求往前捯。

只要引物3端的3-5個鹼基是不同的,就能區分兩個模板。

你要是兩段序列之間,連續3個鹼基不同的區域都找不著,那就根本做不了PCR,換別的方法。


看了半天似乎看懂了:題主好像是想要避免序列太像以至於引物特異性不好。

這個是比較困難的,因為引物自己也對序列有一些需求,比如沒有發卡結構、退火溫度要合適,滿足了引物需求就可能滿足不了特異性需求。

你也許可以這樣試試:

  1. 稍微降低一些引物自己的要求,比如GC含量什麼的,看看能不能找到特異性更好的位置。
  2. 既然CDS自己特別像,那能不能在CDS的外面設計引物?外圍序列會不會差別更大?

我自己不做實驗,這些只是一些通用經驗。


import AlignIO from bio

for everyOneAlignment in AlignIO.parse(yourAlignmentData):

tmp = getEvery50bpAndCheckTheSimilarity(everyOneALignment)

if tmp is whatYouWanted: output

else: pass

大致這麼個偽碼吧。。


做多重序列比對呢?


推薦閱讀:
查看原文 >>
相關文章