如何在CDS序列中選出植物中定量非同源性基因序列？

找的基因中的序列同源性太高，無法做定量表達，希望能從cds中高效選出同源性比較低的序列從而設計引物，跑熒光定量。

謝邀 @范甘迪亞。恕我直言，這個問題的題目和附加描述就不是中國話。

「選出植物中定量非同源性基因序列」，我不知道從哪斷句。

建議使用規範的科學用語、正確的語法，重寫問題。我反正是沒看懂這是問的什麼。

我就假設你的問題是「對兩個同源性很高的序列模板，如何設計引物，使得引物只特異性地擴增其中的一個」吧。

系統一點的辦法，用打包好的演算法 PRIMEGENSw3，原理看這篇文獻：

Homolog-specific PCR primer design for profiling splice variants?

www.ncbi.nlm.nih.gov

自己手動設計，拿兩段序列做個alignment，然後找不同。有的可能是一個鹼基不同，有的可能是連續的7-8個鹼基不同，找一段比較長的變異位點，作為引物結合位點的3』端，然後就按正常的設計引物的要求往前捯。

只要引物3端的3-5個鹼基是不同的，就能區分兩個模板。

你要是兩段序列之間，連續3個鹼基不同的區域都找不著，那就根本做不了PCR，換別的方法。

看了半天似乎看懂了：題主好像是想要避免序列太像以至於引物特異性不好。

這個是比較困難的，因為引物自己也對序列有一些需求，比如沒有發卡結構、退火溫度要合適，滿足了引物需求就可能滿足不了特異性需求。

你也許可以這樣試試：

我自己不做實驗，這些只是一些通用經驗。

import AlignIO from bio

for everyOneAlignment in AlignIO.parse(yourAlignmentData):

tmp = getEvery50bpAndCheckTheSimilarity(everyOneALignment)

if tmp is whatYouWanted: output

else: pass

大致這麼個偽碼吧。。

做多重序列比對呢？

已知蛋白氨基酸序列，怎麼獲取其實際核苷酸序列？