摘要:表觀遺傳學的定義一直在不斷的豐富。最早在1942年,Waddington CH對這門學科進行了定義,他認為:表觀遺傳學是一門生物學分支,它研究基因與基因產物間的相互作用對錶形造成影響的原因[1]。從定義中已經能夠看出,當時的科學家已經感覺到從基因型到表形存在複雜的調控網路。隨著科學的發展,DNA甲基化和組蛋白修飾的發現,表觀遺傳學有了更加豐富的定義,簡而言之,即研究DNA序列不變的情況下,基因的活性、表達量和表達的位置等功能發生改變且可遺傳給下一代的原因[2]。這是純粹表觀遺傳學的定義。相對而言,現在還有許多非純表觀遺傳學的研究,它們只研究這一世代中,表觀修飾對基因表達及表形的影響,目的是解釋基因表達調控的機理。與此同時,許多新的調控因素被發現,比如非編碼序列、新的組蛋白變體家族和蛋白修飾被發現和研究,表觀遺傳學的內容也更加豐富。這就如同我們今天使用的「DNA」一詞,它的含義越來越不能夠被準確的定義一樣,這是因為它的內容一直在不斷的豐富。現在通過表觀遺傳學研究的得到主要認識是:基因功能的改變可能是由於環境的影響,生長發育的不同階段和基因印記等因素的影響,造成染色質壓縮程度降低,使原本不易被轉錄因子接近的DNA序列暴露出來,從而能夠被轉錄和表達並對錶形造成影響;反之,使染色質壓縮,基因沉默。染色質結構的改變大多是由於DNA甲基化和組蛋白修飾造成的,這些表觀修飾會招募相關蛋白或蛋白複合物促進核小體滑動,從而使轉錄起始位點暴露出來。

表觀遺傳學的發展介紹

表觀遺傳學雖然早在上個世紀就被提出,但直到二十世紀末才開始被高度的關注,這或許是由於早期實驗技術缺乏和對基因組的認識不足造成的。隨著二十一世紀測序技術的發展,人們對包括人在內的多種生物的基因組進行測序[3,4],使我們能夠認識到基因序列的差異與物種間表形差異的關係,但同時也帶了許多困惑,比如同一套基因組是如何決定生物的形態建成和組織分化,為什麼會存在組織間的表達差異等。科學家們為此展開了深入研究後,如同發現新大陸引領起表觀遺傳學研究的熱潮,同時大刀闊斧的開拓這一新領域。越來越多的研究成果使我們對基因的表達調控、組織分化和環境響應等有了更深刻的認識,讓發現了與DNA序列緊密相連的表觀修飾對錶形的貢獻。從美國國家生物信息中心(NCBI)檢索「表觀遺傳學」相關文獻,可以明顯的感受到表觀遺傳學在進入二十一世紀後迅猛發展的趨勢(圖1),有學者甚至認為這是「拉馬克主義的復興」,因為這打破了我們一貫認為的基因決定表形,決定在自然選擇中佔優勢還是劣勢的思想,讓我們認識到環境同樣對錶形存在影響,我們可以通過自身的努力改變環境,改變我們的表形並對後代的表形造成影響,可以說這是一門鼓舞人心的研究。

圖1. 在NCBI檢索「epigenetic」一詞,Pubmed中包含的歷年相關文獻數量。

表觀遺傳學的研究現狀

目前,表觀遺傳學的研究已經從早期的單基因甲基化水平研究,向全基因組甲基化水平拓展,並結合基因組學、蛋白組學組學和代謝組學等多種數據一起研究DNA甲基化對錶形改變的貢獻;此外,還有一批科學家結合DNA甲基化修飾、組蛋白修飾和相關伴侶蛋白,研究DNA甲基化形成和維持的機理,揭示甲基化在生長發育過程中動態變化以及存在組織特異性差異的原因[5]。隨著研究的不斷深入,表觀遺傳學涉及的領域也越廣,從微生物到動物,從基礎研究到人類疾病治療都能看到與表觀遺傳相關的文獻[6-8]。最近,科學家們開始對DNA甲基化這類不改變DNA序列又能使基因沉默的表觀修飾感興趣,正在努力開發出能夠精準甲基化DNA片段並使其沉默的工具。

表觀遺傳研究一般是以表觀修飾因子出發的。最早進行深入研究的表觀修飾是DNA甲基化,它之所以迷人是因為它存在與DNA序列上,它需要通過重硫酸鹽測序才能被觀察到,它的存在會影響染色質的壓縮程度、轉錄因子的結合以及周圍組蛋白的類型,進而造成基因的表達受到影響[5]。但DNA甲基化並非只抑制基因表達,它往往與組蛋白修飾共同調節轉錄。比如基因區中如果DNA甲基化佔主要,相對的H2A.Z這類組蛋白變體分佈體就會減少,具有這種分佈形式的基因大都是持續性表達的組成型基因;相反的,H2A.Z在基因區中分佈廣,DNA甲基化程度相對就會低,這樣的基因大都是誘導表達型的基因[5]。造成這一現象的機理還在研究,目前認為是H2A.Z的存在會抑制RNA轉錄沒得延伸,使基因不能夠正常轉錄,當H2A.Z周圍的DNA被甲基化,那麼H2A.Z會被其它類型的H2A蛋白替換,從而RNA酶能夠正常轉錄[9]。

組蛋白是繼DNA甲基化之後表觀遺傳學研究得比較火熱的領域。目前主要分為兩個方向,一個是組蛋白變體與組蛋白修飾,研究不同的變體家族或其上的甲基化、乙醯化和磷酸化修飾對基因表達的影響;另一個是組蛋白相關伴侶蛋白的研究,主要是研究組蛋白進出核小體和如何被加上修飾基團的機理研究,它們共同的目的都是為了更好的理解基因是如何實現特異性表達的,並且這些組蛋白及其修飾對遺傳信息的影響。

組蛋白主要分為H2A、H2B、H3和H4四種類型[10],目前對H2A和H3兩種組蛋白研究較多,更進一步,H2A研究的大多是其變體家族蛋白,如H2A.Z、H2A.W、H2A.X等;而H3蛋白主要研究其N段的賴氨酸修飾與基因組的關係,比如H3K9me2(第9位賴氨酸被添加了兩個甲基)和H3K27me3(第27位賴氨酸被添加了三個甲基)都存在都存在與異染色質中,但前者出現在永久性異染色質中,即整個生命過程中都保持沉默的染色質;而後者出現在暫時性異染色質中,即隨著發育時期的改變或者組織的不同,會轉變為常染色質的一類異染色質[11]。

組蛋白八聚體是核小體的核心成分,它由兩個H2A、H2B、H3和H4四聚體構成,之後與150bp左右的DNA共同構成了核小體[12],一個個核小體串聯在一起再經過纏繞、摺疊和壓縮,最總成為染色體。因此,在基因遺傳給下一代的過程中,其周圍的組蛋白及其修飾也會隨其一起遷移,並對生殖細胞和胚胎的早期發育造成影響[13]。因為在基因表達和遺傳中發揮著不改變DNA序列,但影響其表達,因此,組蛋白及其修飾的研究也因此受到關注。

目前對組蛋白伴侶蛋白的研究主要集中在如何替換核小體中的組蛋白以及如何在組蛋白上添加修飾。以H2A.Z的伴侶蛋白研究為例,H2A.Z入和離開核小體需要SWR1和INO80的幫組,前者負責將H2A.Z放置到核小體中[14],而後者是將H2A.Z從核小體中移走[15],它們參與完成對H2A.Z分佈的調節,從而改變基因組的表達模式;還有就是對H3蛋白的甲基化添加和去除的研究,目前在擬南芥中已經發現了早花相關蛋白REF6能夠去除H3K27me3上的甲基化,使其周圍原本沉默的基因被激活[11]。隨著研究的深入,不斷的有組蛋白相關伴侶蛋白被發現和結構解析,這些信息將幫助我們更好的理解組蛋白修飾以及分佈調控的機理。

圖2. 對錶觀遺傳學研究對象的歸納

表觀遺傳分子機理的研究成果介紹

在DNA甲基化的研究中,發現高度DNA甲基化的區域大都是異染色質區,裡麪包含有大量的重複序列。這些重複序列又可以細分為轉座子序列(TEs)和串列重複序列,之後,通過多種植物基因組大小與重複序列的關聯分析,發現TEs與基因組大小關係最顯著[16],研究者認為這是因為TEs中的逆轉錄型轉座子能夠通過「複製——轉座」的模式進行擴張造成的,在TEs擴張(轉座)的過程中,它的序列會攜帶DNA甲基化傳播到被插入的區域,並影響該區域DNA甲基化水平[16];當其轉座到基因的增強子區域時,它會對基因的表達起調控作用[17]。TEs會造成甲基分佈的改變,同時也會對基因組的穩定性和染色體進化造成影響。在對摩擦禾屬(Tripsacum,玉米的近源種屬)的基因組研究中,TEs等重複序列對基因組和染色體在進化過程中發生的改變起到非常大的作用,比如造成同一屬不同種間基因組大小的差異和染色體倍性的差異[18]。

除了研究DNA甲基化的序列特徵外,還有科學家將擬南芥羣體中的DNA甲基化的差異與基因的表達進行關聯分析[19],雖然結果顯示DNA甲基化無論對數量性狀基因還是對質量性狀的基因影響都不及單核苷酸多態性(SNPs)的高,但這種嘗試為理解DNA甲基化對錶形的貢獻提供了新的思路。

圖3. 對重複序列類型的歸納。

組蛋白與DNA關係緊密,因此組蛋白及其修飾的研究結果也十分豐富。以H2A.Z的研究結果為例,目前發現它對開花、抗逆和重組等相關基因都存在關係。在開花方面,H2A.Z對抑制開花的基因FLC的轉錄激活發揮著重要作用,因為SWR-C對H2A.Z具有置換作用,同時它與起始FLC基因表達的FRI-C存在互作,FRI-C通過招募SWR1-C到FLC的轉錄起始位點附近,將啟動子中核小體的H2A替換成H2A.Z,從而促進RNA聚合酶II對FLC的轉錄。將SWR-C中的活性功能蛋白突變後,會引起花被數量增多,結實率降低等表形,說明H2A.Z對抑制開花發揮著作用[20]。關於H2A.Z是如何調控轉錄起始的,目前的研究記過認為是H2A.Z降低了RNA聚合酶II起始轉錄時對能量的需求,因為H2A.Z能夠抑制核小體間的分子互作,這一方面降低核小體的緊密程度,另一方面增加RNA聚合酶II(RNAPII)結合轉錄起始位點的可接近性[21]。然而,H2A.Z並非只起促進轉錄的作用,有時也會抑制RNAPII的前進。已經發現在擬南芥中含有H2A.Z的核小體存在於轉錄起始位點或基因體時會展現出不同的功能,但基因區中存在大量的H2A.Z時,基因大都是誘導表達型基因,在受誘導表達時,基因區中的H2A.Z會被替換為普通的H2A蛋白,RNAPII就能夠順利的在基因區上延伸完成轉錄[22]。除了這些,H2A.Z還對mRNA的可變剪接,遺傳重組等發揮著作用,隨著研究的深入,預期會有更多的功能被發現。

除了上面提到的與H2A.Z置換相關的伴侶蛋白SWR-C外,科學家們還發現了許多其它伴侶蛋白。比如H3蛋白上的賴氨酸甲基化修飾,它可謂是豐富多彩。除了上面提到的H3K27me3外,還有H3K4me3、H3K9me2、H3K36me3等,它們各自發揮著獨特的功能,並參與到基因表達調控的過程中。

圖4.已經報道的部分H2A.Z功能及其受調控進出核小體的示意圖。

擬南芥的開花因為其獨特的春花作用,一直以來都是表觀遺傳研究的熱點。REF6通過去除基因組中開花相關基因周圍的H3K27me3,促進開花基因的表達。近期的研究揭示了REF6通過自身的鋅指結構域結合特定的DNA序列「CTCTGYTY」,作者通過氨基酸序列突變、ChIP-Seq實驗和體外去甲基化效率檢測等實驗,找到了這一序列並檢測REF6參與到的代謝路徑[11]。除了開花基因被激活,擬南芥的開花抑制基因也會被重新激活。在擬南芥的胚發育過程中,LEC1會授粉後第一天,就會清除掉親代基因組中FLC基因上的H3K27me3修飾,使得FLC基因重新被激活,開花基因的表達因此被抑制,之後FLC又會因為春化作用被沉默[23]。這一機理的發現也解釋了為什麼每一代擬南芥都需要進行春化處理才能開花的原因。

討論

表觀遺傳學一方面使我們解決了一些DNA序列無法解釋的問題,另一方使我們對基因和轉錄因子間關係有了更好的額理解,這其中還有很多的未知需要我們去探索。雖然,我們已經對單基因的表觀修飾研究得很深入,但在全基因組範圍內的甲基化修飾,尤其是組蛋白修飾的理解還很不足,未來我認為表觀遺傳學將會結合基因組學、蛋白質組學以及代謝組一起研究,從全基因組的角度來研究表觀修飾對基因表達以及表形的影響。同時,表觀遺傳學的研究將影響許多領域的發展,比如,農業育種中,未來的分子遺傳育種將不只考慮DNA序列差異對錶形的影響,還會考慮表觀因素差異對性狀的影響;醫藥衛生領域,通過開發具有表觀修飾功能的蛋白複合物,對特定的基因區域進行表觀修飾,在不改變DNA序列的情況上改變基因的表達,治療一些遺傳疾病;科學研究領域,表觀遺傳學已經幫助我們理解來許多DNA序列解釋不了的表形問題,未來它將引導我們更好的理解遺傳物質中的另一套密碼——表觀修飾。表觀遺傳學迅猛發展,目前來看還未遇到嚴重的倫理道德問題,但要想使這一門學科健康發展,科學家們還是需要保持警惕,必要時制定合理的行業規範。

參考文獻:

1Waddington, C. H. Towards a theoretical biology. Nature218, 525-527 (1968).

2Dupont, C., Armant, D. R. & Brenner, C. A. Epigenetics: definition, mechanisms and clinical perspective. Semin Reprod Med27, 351-357, doi:10.1055/s-0029-1237423 (2009).

3Venter, J. C. et al. The sequence of the human genome. Science291, 1304-1351, doi:10.1126/science.1058040 (2001).

4International Human Genome Sequencing, C. Finishing the euchromatic sequence of the human genome. Nature431, 931-945, doi:10.1038/nature03001 (2004).

5Coleman-Derr, D. & Zilberman, D. DNA methylation, H2A.Z, and the regulation of constitutive expression. Cold Spring Harb Symp Quant Biol77, 147-154, doi:10.1101/sqb.2012.77.014944 (2012).

6Neves, L. T. et al. The histone variant H2A.Z promotes efficient cotranscriptional splicing in S. cerevisiae. Genes Dev31, 702-717, doi:10.1101/gad.295188.116 (2017).

7 Cai, H. et al. ERECTA signaling controls Arabidopsis inflorescence architecture through chromatin-mediated activation of PRE1 expression. New Phytol214, 1579-1596, doi:10.1111/nph.14521 (2017).

8Pazienza, V. et al. Histone macroH2A1.2 promotes metabolic health and leanness by inhibiting adipogenesis. Epigenetics Chromatin9, 45, doi:10.1186/s13072-016-0098-9 (2016).

9Subramanian, V., Fields, P. A. & Boyer, L. A. H2A.Z: a molecular rheostat for transcriptional control. F1000Prime Rep7, 01, doi:10.12703/P7-01 (2015).

10Thatcher, T. H. & Gorovsky, M. A. Phylogenetic analysis of the core histones H2A, H2B, H3, and H4. Nucleic Acids Res22, 174-179 (1994).

11 Li, C. et al. Concerted genomic targeting of H3K27 demethylase REF6 and chromatin-remodeling ATPase BRM in Arabidopsis. Nat Genet48, 687-693, doi:10.1038/ng.3555 (2016).

12Cutter, A. R. & Hayes, J. J. A brief review of nucleosome structure. FEBS Lett589, 2914-2922, doi:10.1016/j.febslet.2015.05.016 (2015).

13Choi, K. et al. Arabidopsis meiotic crossover hot spots overlap with H2A.Z nucleosomes at gene promoters. Nat Genet45, 1327-1336, doi:10.1038/ng.2766 (2013).

14 Su, Y. et al. Phosphorylation of Histone H2A at Serine 95: A Plant-Specific Mark Involved in Flowering Time Regulation and H2A.Z Deposition. Plant Cell29, 2197-2213, doi:10.1105/tpc.17.00266 (2017).

15Lademann, C. A., Renkawitz, J., Pfander, B. & Jentsch, S. The INO80 Complex Removes H2A.Z to Promote Presynaptic Filament Formation during Homologous Recombination. Cell Rep19, 1294-1303, doi:10.1016/j.celrep.2017.04.051 (2017).

16 Li, S. F. et al. Chromosome Evolution in Connection with Repetitive Sequences and Epigenetics in Plants. Genes (Basel)8, doi:10.3390/genes8100290 (2017).

17Robbins, M. L., Sekhon, R. S., Meeley, R. & Chopra, S. A Mutator transposon insertion is associated with ectopic expression of a tandemly repeated multicopy Myb gene pericarp color1 of maize. Genetics178, 1859-1874, doi:10.1534/genetics.107.082503 (2008).

18Zhu, Q., Cai, Z., Tang, Q. & Jin, W. Repetitive sequence analysis and karyotyping reveal different genome evolution and speciation of diploid and tetraploid Tripsacum dactyloides. The Crop Journal4, 247-255, doi:10.1016/j.cj.2016.04.003 (2016).

19Meng, D. et al. Limited Contribution of DNA Methylation Variation to Expression Regulation in Arabidopsis thaliana. PLoS Genet12, e1006141, doi:10.1371/journal.pgen.1006141 (2016).

20Choi, K. et al. Arabidopsis homologs of components of the SWR1 complex regulate flowering and plant development. Development134, 1931-1941, doi:10.1242/dev.001891 (2007).

21 Fan, J. Y., Gordon, F., Luger, K., Hansen, J. C. & Tremethick, D. J. The essential histone variant H2A.Z regulates the equilibrium between different chromatin conformational states. Nat Struct Biol9, 172-176, doi:10.1038/nsb767 (2002).

22Coleman-Derr, D. & Zilberman, D. Deposition of histone variant H2A.Z within gene bodies regulates responsive genes. PLoS Genet8, e1002988, doi:10.1371/journal.pgen.1002988 (2012).

23 Tao, Z. et al. Embryonic epigenetic reprogramming by a pioneer transcription factor in plants. Nature551, 124-128, doi:10.1038/nature24300 (2017).


推薦閱讀:
相關文章