如何在CDS序列中选出植物中定量非同源性基因序列?
找的基因中的序列同源性太高,无法做定量表达,希望能从cds中高效选出同源性比较低的序列从而设计引物,跑荧光定量。
谢邀 @范甘迪亚 。恕我直言,这个问题的题目和附加描述就不是中国话。
「选出植物中定量非同源性基因序列」,我不知道从哪断句。
建议使用规范的科学用语、正确的语法,重写问题。我反正是没看懂这是问的什么。
我就假设你的问题是「对两个同源性很高的序列模板,如何设计引物,使得引物只特异性地扩增其中的一个」吧。
系统一点的办法,用打包好的演算法 PRIMEGENSw3,原理看这篇文献:
Homolog-specific PCR primer design for profiling splice variants?www.ncbi.nlm.nih.gov
自己手动设计,拿两段序列做个alignment,然后找不同。有的可能是一个碱基不同,有的可能是连续的7-8个碱基不同,找一段比较长的变异位点,作为引物结合位点的3』端,然后就按正常的设计引物的要求往前捯。
只要引物3端的3-5个碱基是不同的,就能区分两个模板。
你要是两段序列之间,连续3个碱基不同的区域都找不著,那就根本做不了PCR,换别的方法。
看了半天似乎看懂了:题主好像是想要避免序列太像以至于引物特异性不好。
这个是比较困难的,因为引物自己也对序列有一些需求,比如没有发卡结构、退火温度要合适,满足了引物需求就可能满足不了特异性需求。
你也许可以这样试试:
- 稍微降低一些引物自己的要求,比如GC含量什么的,看看能不能找到特异性更好的位置。
- 既然CDS自己特别像,那能不能在CDS的外面设计引物?外围序列会不会差别更大?
我自己不做实验,这些只是一些通用经验。
import AlignIO from bio
for everyOneAlignment in AlignIO.parse(yourAlignmentData):
tmp = getEvery50bpAndCheckTheSimilarity(everyOneALignment)
if tmp is whatYouWanted: output
else: pass
大致这么个伪码吧。。
做多重序列比对呢?
推荐阅读: