如何在CDS序列中选出植物中定量非同源性基因序列？

找的基因中的序列同源性太高，无法做定量表达，希望能从cds中高效选出同源性比较低的序列从而设计引物，跑荧光定量。

谢邀 @范甘迪亚。恕我直言，这个问题的题目和附加描述就不是中国话。

「选出植物中定量非同源性基因序列」，我不知道从哪断句。

建议使用规范的科学用语、正确的语法，重写问题。我反正是没看懂这是问的什么。

我就假设你的问题是「对两个同源性很高的序列模板，如何设计引物，使得引物只特异性地扩增其中的一个」吧。

系统一点的办法，用打包好的演算法 PRIMEGENSw3，原理看这篇文献：

Homolog-specific PCR primer design for profiling splice variants?

www.ncbi.nlm.nih.gov

自己手动设计，拿两段序列做个alignment，然后找不同。有的可能是一个碱基不同，有的可能是连续的7-8个碱基不同，找一段比较长的变异位点，作为引物结合位点的3』端，然后就按正常的设计引物的要求往前捯。

只要引物3端的3-5个碱基是不同的，就能区分两个模板。

你要是两段序列之间，连续3个碱基不同的区域都找不著，那就根本做不了PCR，换别的方法。

看了半天似乎看懂了：题主好像是想要避免序列太像以至于引物特异性不好。

这个是比较困难的，因为引物自己也对序列有一些需求，比如没有发卡结构、退火温度要合适，满足了引物需求就可能满足不了特异性需求。

你也许可以这样试试：

我自己不做实验，这些只是一些通用经验。

import AlignIO from bio

for everyOneAlignment in AlignIO.parse(yourAlignmentData):

tmp = getEvery50bpAndCheckTheSimilarity(everyOneALignment)

if tmp is whatYouWanted: output

else: pass

大致这么个伪码吧。。

做多重序列比对呢？

已知蛋白氨基酸序列，怎么获取其实际核苷酸序列？