摘要:表观遗传学的定义一直在不断的丰富。最早在1942年,Waddington CH对这门学科进行了定义,他认为:表观遗传学是一门生物学分支,它研究基因与基因产物间的相互作用对表形造成影响的原因[1]。从定义中已经能够看出,当时的科学家已经感觉到从基因型到表形存在复杂的调控网路。随著科学的发展,DNA甲基化和组蛋白修饰的发现,表观遗传学有了更加丰富的定义,简而言之,即研究DNA序列不变的情况下,基因的活性、表达量和表达的位置等功能发生改变且可遗传给下一代的原因[2]。这是纯粹表观遗传学的定义。相对而言,现在还有许多非纯表观遗传学的研究,它们只研究这一世代中,表观修饰对基因表达及表形的影响,目的是解释基因表达调控的机理。与此同时,许多新的调控因素被发现,比如非编码序列、新的组蛋白变体家族和蛋白修饰被发现和研究,表观遗传学的内容也更加丰富。这就如同我们今天使用的「DNA」一词,它的含义越来越不能够被准确的定义一样,这是因为它的内容一直在不断的丰富。现在通过表观遗传学研究的得到主要认识是:基因功能的改变可能是由于环境的影响,生长发育的不同阶段和基因印记等因素的影响,造成染色质压缩程度降低,使原本不易被转录因子接近的DNA序列暴露出来,从而能够被转录和表达并对表形造成影响;反之,使染色质压缩,基因沉默。染色质结构的改变大多是由于DNA甲基化和组蛋白修饰造成的,这些表观修饰会招募相关蛋白或蛋白复合物促进核小体滑动,从而使转录起始位点暴露出来。

表观遗传学的发展介绍

表观遗传学虽然早在上个世纪就被提出,但直到二十世纪末才开始被高度的关注,这或许是由于早期实验技术缺乏和对基因组的认识不足造成的。随著二十一世纪测序技术的发展,人们对包括人在内的多种生物的基因组进行测序[3,4],使我们能够认识到基因序列的差异与物种间表形差异的关系,但同时也带了许多困惑,比如同一套基因组是如何决定生物的形态建成和组织分化,为什么会存在组织间的表达差异等。科学家们为此展开了深入研究后,如同发现新大陆引领起表观遗传学研究的热潮,同时大刀阔斧的开拓这一新领域。越来越多的研究成果使我们对基因的表达调控、组织分化和环境响应等有了更深刻的认识,让发现了与DNA序列紧密相连的表观修饰对表形的贡献。从美国国家生物信息中心(NCBI)检索「表观遗传学」相关文献,可以明显的感受到表观遗传学在进入二十一世纪后迅猛发展的趋势(图1),有学者甚至认为这是「拉马克主义的复兴」,因为这打破了我们一贯认为的基因决定表形,决定在自然选择中占优势还是劣势的思想,让我们认识到环境同样对表形存在影响,我们可以通过自身的努力改变环境,改变我们的表形并对后代的表形造成影响,可以说这是一门鼓舞人心的研究。

图1. 在NCBI检索「epigenetic」一词,Pubmed中包含的历年相关文献数量。

表观遗传学的研究现状

目前,表观遗传学的研究已经从早期的单基因甲基化水平研究,向全基因组甲基化水平拓展,并结合基因组学、蛋白组学组学和代谢组学等多种数据一起研究DNA甲基化对表形改变的贡献;此外,还有一批科学家结合DNA甲基化修饰、组蛋白修饰和相关伴侣蛋白,研究DNA甲基化形成和维持的机理,揭示甲基化在生长发育过程中动态变化以及存在组织特异性差异的原因[5]。随著研究的不断深入,表观遗传学涉及的领域也越广,从微生物到动物,从基础研究到人类疾病治疗都能看到与表观遗传相关的文献[6-8]。最近,科学家们开始对DNA甲基化这类不改变DNA序列又能使基因沉默的表观修饰感兴趣,正在努力开发出能够精准甲基化DNA片段并使其沉默的工具。

表观遗传研究一般是以表观修饰因子出发的。最早进行深入研究的表观修饰是DNA甲基化,它之所以迷人是因为它存在与DNA序列上,它需要通过重硫酸盐测序才能被观察到,它的存在会影响染色质的压缩程度、转录因子的结合以及周围组蛋白的类型,进而造成基因的表达受到影响[5]。但DNA甲基化并非只抑制基因表达,它往往与组蛋白修饰共同调节转录。比如基因区中如果DNA甲基化占主要,相对的H2A.Z这类组蛋白变体分布体就会减少,具有这种分布形式的基因大都是持续性表达的组成型基因;相反的,H2A.Z在基因区中分布广,DNA甲基化程度相对就会低,这样的基因大都是诱导表达型的基因[5]。造成这一现象的机理还在研究,目前认为是H2A.Z的存在会抑制RNA转录没得延伸,使基因不能够正常转录,当H2A.Z周围的DNA被甲基化,那么H2A.Z会被其它类型的H2A蛋白替换,从而RNA酶能够正常转录[9]。

组蛋白是继DNA甲基化之后表观遗传学研究得比较火热的领域。目前主要分为两个方向,一个是组蛋白变体与组蛋白修饰,研究不同的变体家族或其上的甲基化、乙醯化和磷酸化修饰对基因表达的影响;另一个是组蛋白相关伴侣蛋白的研究,主要是研究组蛋白进出核小体和如何被加上修饰基团的机理研究,它们共同的目的都是为了更好的理解基因是如何实现特异性表达的,并且这些组蛋白及其修饰对遗传信息的影响。

组蛋白主要分为H2A、H2B、H3和H4四种类型[10],目前对H2A和H3两种组蛋白研究较多,更进一步,H2A研究的大多是其变体家族蛋白,如H2A.Z、H2A.W、H2A.X等;而H3蛋白主要研究其N段的赖氨酸修饰与基因组的关系,比如H3K9me2(第9位赖氨酸被添加了两个甲基)和H3K27me3(第27位赖氨酸被添加了三个甲基)都存在都存在与异染色质中,但前者出现在永久性异染色质中,即整个生命过程中都保持沉默的染色质;而后者出现在暂时性异染色质中,即随著发育时期的改变或者组织的不同,会转变为常染色质的一类异染色质[11]。

组蛋白八聚体是核小体的核心成分,它由两个H2A、H2B、H3和H4四聚体构成,之后与150bp左右的DNA共同构成了核小体[12],一个个核小体串联在一起再经过缠绕、折叠和压缩,最总成为染色体。因此,在基因遗传给下一代的过程中,其周围的组蛋白及其修饰也会随其一起迁移,并对生殖细胞和胚胎的早期发育造成影响[13]。因为在基因表达和遗传中发挥著不改变DNA序列,但影响其表达,因此,组蛋白及其修饰的研究也因此受到关注。

目前对组蛋白伴侣蛋白的研究主要集中在如何替换核小体中的组蛋白以及如何在组蛋白上添加修饰。以H2A.Z的伴侣蛋白研究为例,H2A.Z入和离开核小体需要SWR1和INO80的帮组,前者负责将H2A.Z放置到核小体中[14],而后者是将H2A.Z从核小体中移走[15],它们参与完成对H2A.Z分布的调节,从而改变基因组的表达模式;还有就是对H3蛋白的甲基化添加和去除的研究,目前在拟南芥中已经发现了早花相关蛋白REF6能够去除H3K27me3上的甲基化,使其周围原本沉默的基因被激活[11]。随著研究的深入,不断的有组蛋白相关伴侣蛋白被发现和结构解析,这些信息将帮助我们更好的理解组蛋白修饰以及分布调控的机理。

图2. 对表观遗传学研究对象的归纳

表观遗传分子机理的研究成果介绍

在DNA甲基化的研究中,发现高度DNA甲基化的区域大都是异染色质区,里面包含有大量的重复序列。这些重复序列又可以细分为转座子序列(TEs)和串列重复序列,之后,通过多种植物基因组大小与重复序列的关联分析,发现TEs与基因组大小关系最显著[16],研究者认为这是因为TEs中的逆转录型转座子能够通过「复制——转座」的模式进行扩张造成的,在TEs扩张(转座)的过程中,它的序列会携带DNA甲基化传播到被插入的区域,并影响该区域DNA甲基化水平[16];当其转座到基因的增强子区域时,它会对基因的表达起调控作用[17]。TEs会造成甲基分布的改变,同时也会对基因组的稳定性和染色体进化造成影响。在对摩擦禾属(Tripsacum,玉米的近源种属)的基因组研究中,TEs等重复序列对基因组和染色体在进化过程中发生的改变起到非常大的作用,比如造成同一属不同种间基因组大小的差异和染色体倍性的差异[18]。

除了研究DNA甲基化的序列特征外,还有科学家将拟南芥群体中的DNA甲基化的差异与基因的表达进行关联分析[19],虽然结果显示DNA甲基化无论对数量性状基因还是对质量性状的基因影响都不及单核苷酸多态性(SNPs)的高,但这种尝试为理解DNA甲基化对表形的贡献提供了新的思路。

图3. 对重复序列类型的归纳。

组蛋白与DNA关系紧密,因此组蛋白及其修饰的研究结果也十分丰富。以H2A.Z的研究结果为例,目前发现它对开花、抗逆和重组等相关基因都存在关系。在开花方面,H2A.Z对抑制开花的基因FLC的转录激活发挥著重要作用,因为SWR-C对H2A.Z具有置换作用,同时它与起始FLC基因表达的FRI-C存在互作,FRI-C通过招募SWR1-C到FLC的转录起始位点附近,将启动子中核小体的H2A替换成H2A.Z,从而促进RNA聚合酶II对FLC的转录。将SWR-C中的活性功能蛋白突变后,会引起花被数量增多,结实率降低等表形,说明H2A.Z对抑制开花发挥著作用[20]。关于H2A.Z是如何调控转录起始的,目前的研究记过认为是H2A.Z降低了RNA聚合酶II起始转录时对能量的需求,因为H2A.Z能够抑制核小体间的分子互作,这一方面降低核小体的紧密程度,另一方面增加RNA聚合酶II(RNAPII)结合转录起始位点的可接近性[21]。然而,H2A.Z并非只起促进转录的作用,有时也会抑制RNAPII的前进。已经发现在拟南芥中含有H2A.Z的核小体存在于转录起始位点或基因体时会展现出不同的功能,但基因区中存在大量的H2A.Z时,基因大都是诱导表达型基因,在受诱导表达时,基因区中的H2A.Z会被替换为普通的H2A蛋白,RNAPII就能够顺利的在基因区上延伸完成转录[22]。除了这些,H2A.Z还对mRNA的可变剪接,遗传重组等发挥著作用,随著研究的深入,预期会有更多的功能被发现。

除了上面提到的与H2A.Z置换相关的伴侣蛋白SWR-C外,科学家们还发现了许多其它伴侣蛋白。比如H3蛋白上的赖氨酸甲基化修饰,它可谓是丰富多彩。除了上面提到的H3K27me3外,还有H3K4me3、H3K9me2、H3K36me3等,它们各自发挥著独特的功能,并参与到基因表达调控的过程中。

图4.已经报道的部分H2A.Z功能及其受调控进出核小体的示意图。

拟南芥的开花因为其独特的春花作用,一直以来都是表观遗传研究的热点。REF6通过去除基因组中开花相关基因周围的H3K27me3,促进开花基因的表达。近期的研究揭示了REF6通过自身的锌指结构域结合特定的DNA序列「CTCTGYTY」,作者通过氨基酸序列突变、ChIP-Seq实验和体外去甲基化效率检测等实验,找到了这一序列并检测REF6参与到的代谢路径[11]。除了开花基因被激活,拟南芥的开花抑制基因也会被重新激活。在拟南芥的胚发育过程中,LEC1会授粉后第一天,就会清除掉亲代基因组中FLC基因上的H3K27me3修饰,使得FLC基因重新被激活,开花基因的表达因此被抑制,之后FLC又会因为春化作用被沉默[23]。这一机理的发现也解释了为什么每一代拟南芥都需要进行春化处理才能开花的原因。

讨论

表观遗传学一方面使我们解决了一些DNA序列无法解释的问题,另一方使我们对基因和转录因子间关系有了更好的额理解,这其中还有很多的未知需要我们去探索。虽然,我们已经对单基因的表观修饰研究得很深入,但在全基因组范围内的甲基化修饰,尤其是组蛋白修饰的理解还很不足,未来我认为表观遗传学将会结合基因组学、蛋白质组学以及代谢组一起研究,从全基因组的角度来研究表观修饰对基因表达以及表形的影响。同时,表观遗传学的研究将影响许多领域的发展,比如,农业育种中,未来的分子遗传育种将不只考虑DNA序列差异对表形的影响,还会考虑表观因素差异对性状的影响;医药卫生领域,通过开发具有表观修饰功能的蛋白复合物,对特定的基因区域进行表观修饰,在不改变DNA序列的情况上改变基因的表达,治疗一些遗传疾病;科学研究领域,表观遗传学已经帮助我们理解来许多DNA序列解释不了的表形问题,未来它将引导我们更好的理解遗传物质中的另一套密码——表观修饰。表观遗传学迅猛发展,目前来看还未遇到严重的伦理道德问题,但要想使这一门学科健康发展,科学家们还是需要保持警惕,必要时制定合理的行业规范。

参考文献:

1Waddington, C. H. Towards a theoretical biology. Nature218, 525-527 (1968).

2Dupont, C., Armant, D. R. & Brenner, C. A. Epigenetics: definition, mechanisms and clinical perspective. Semin Reprod Med27, 351-357, doi:10.1055/s-0029-1237423 (2009).

3Venter, J. C. et al. The sequence of the human genome. Science291, 1304-1351, doi:10.1126/science.1058040 (2001).

4International Human Genome Sequencing, C. Finishing the euchromatic sequence of the human genome. Nature431, 931-945, doi:10.1038/nature03001 (2004).

5Coleman-Derr, D. & Zilberman, D. DNA methylation, H2A.Z, and the regulation of constitutive expression. Cold Spring Harb Symp Quant Biol77, 147-154, doi:10.1101/sqb.2012.77.014944 (2012).

6Neves, L. T. et al. The histone variant H2A.Z promotes efficient cotranscriptional splicing in S. cerevisiae. Genes Dev31, 702-717, doi:10.1101/gad.295188.116 (2017).

7 Cai, H. et al. ERECTA signaling controls Arabidopsis inflorescence architecture through chromatin-mediated activation of PRE1 expression. New Phytol214, 1579-1596, doi:10.1111/nph.14521 (2017).

8Pazienza, V. et al. Histone macroH2A1.2 promotes metabolic health and leanness by inhibiting adipogenesis. Epigenetics Chromatin9, 45, doi:10.1186/s13072-016-0098-9 (2016).

9Subramanian, V., Fields, P. A. & Boyer, L. A. H2A.Z: a molecular rheostat for transcriptional control. F1000Prime Rep7, 01, doi:10.12703/P7-01 (2015).

10Thatcher, T. H. & Gorovsky, M. A. Phylogenetic analysis of the core histones H2A, H2B, H3, and H4. Nucleic Acids Res22, 174-179 (1994).

11 Li, C. et al. Concerted genomic targeting of H3K27 demethylase REF6 and chromatin-remodeling ATPase BRM in Arabidopsis. Nat Genet48, 687-693, doi:10.1038/ng.3555 (2016).

12Cutter, A. R. & Hayes, J. J. A brief review of nucleosome structure. FEBS Lett589, 2914-2922, doi:10.1016/j.febslet.2015.05.016 (2015).

13Choi, K. et al. Arabidopsis meiotic crossover hot spots overlap with H2A.Z nucleosomes at gene promoters. Nat Genet45, 1327-1336, doi:10.1038/ng.2766 (2013).

14 Su, Y. et al. Phosphorylation of Histone H2A at Serine 95: A Plant-Specific Mark Involved in Flowering Time Regulation and H2A.Z Deposition. Plant Cell29, 2197-2213, doi:10.1105/tpc.17.00266 (2017).

15Lademann, C. A., Renkawitz, J., Pfander, B. & Jentsch, S. The INO80 Complex Removes H2A.Z to Promote Presynaptic Filament Formation during Homologous Recombination. Cell Rep19, 1294-1303, doi:10.1016/j.celrep.2017.04.051 (2017).

16 Li, S. F. et al. Chromosome Evolution in Connection with Repetitive Sequences and Epigenetics in Plants. Genes (Basel)8, doi:10.3390/genes8100290 (2017).

17Robbins, M. L., Sekhon, R. S., Meeley, R. & Chopra, S. A Mutator transposon insertion is associated with ectopic expression of a tandemly repeated multicopy Myb gene pericarp color1 of maize. Genetics178, 1859-1874, doi:10.1534/genetics.107.082503 (2008).

18Zhu, Q., Cai, Z., Tang, Q. & Jin, W. Repetitive sequence analysis and karyotyping reveal different genome evolution and speciation of diploid and tetraploid Tripsacum dactyloides. The Crop Journal4, 247-255, doi:10.1016/j.cj.2016.04.003 (2016).

19Meng, D. et al. Limited Contribution of DNA Methylation Variation to Expression Regulation in Arabidopsis thaliana. PLoS Genet12, e1006141, doi:10.1371/journal.pgen.1006141 (2016).

20Choi, K. et al. Arabidopsis homologs of components of the SWR1 complex regulate flowering and plant development. Development134, 1931-1941, doi:10.1242/dev.001891 (2007).

21 Fan, J. Y., Gordon, F., Luger, K., Hansen, J. C. & Tremethick, D. J. The essential histone variant H2A.Z regulates the equilibrium between different chromatin conformational states. Nat Struct Biol9, 172-176, doi:10.1038/nsb767 (2002).

22Coleman-Derr, D. & Zilberman, D. Deposition of histone variant H2A.Z within gene bodies regulates responsive genes. PLoS Genet8, e1002988, doi:10.1371/journal.pgen.1002988 (2012).

23 Tao, Z. et al. Embryonic epigenetic reprogramming by a pioneer transcription factor in plants. Nature551, 124-128, doi:10.1038/nature24300 (2017).


推荐阅读:
相关文章