在過去的 20 多年中,表觀遺傳學從點到線,從線到面,到如今的全面蓬勃發展,並被認為是最具潛力獲得諾貝爾獎的領域之一。2016 年,表觀遺傳學領域的權威 C. David AllisThomas JenuweinNature Review Genetics 發表了題為 The molecular hallmarks of epigenetic control 的 Perspectives 文章,系統性回顧了過去 20 年來表觀遺傳學領域的突破性進展,為理解表觀遺傳學提供了全景式的解讀。文章自 2016 年 8 月發表以來,至今已被引用 489 次(Google scholar 數據)。為了幫助對錶觀遺感測興趣的小夥伴深入理解表觀遺傳學,我們特整理了全文的要點,供大家參考。

全文共分為六個部分,導語部分簡要介紹了全文的基本內容,第二部分《表觀遺傳學的基礎》簡要介紹了 DNA 甲基化、核小體和組蛋白修飾的基本概念,這些正是構成表觀遺傳學的物質基礎;第三部分《染色質狀態的酶學定義》闡明瞭染色質的兩種狀態——常染色質和異染色質,以及它們與基因活性之間的關聯;第四部分《表觀遺傳研究的現代時期》中,作者將 1996~2016 年這 20 年間表觀遺傳的研究定義為「表觀遺傳研究的現代時期(the modern era of epigenetic research)」,並從組蛋白密碼假說及相關理論、組蛋白修飾和 DNA 甲基化、非編碼 RNA 和基因轉錄沉默、核小體重塑和組蛋白變體、所有染色質標記都是可逆的、二價染色質(bivalent chromatin)和表觀基因組特徵等六個方面進行闡述;第五部分《發育與疾病》介紹了表觀遺傳與疾病之間的關聯,並從重編程的表觀遺傳障礙、癌症和表觀遺傳治療、免疫防禦、染色質遺傳(記憶)等四個方面展開,其中還涉及多種表觀遺傳藥物的開發策略;最後展望部分對全文進行了簡要總結,並展望了表觀遺傳學今後的發展。

全文超過 14400 字,可收藏閱讀,或直接跳轉至感興趣的部分。

摘要:過去 20 年(1996~2016 年)中,科學家們鑒定了多種染色質修飾酶,探索了各種刺激(生理和病理)信號引起染色質改變的分子機制,並取得了一系列突破性進展,這使得我們對於表觀遺傳學的認知,從一系列不尋常的生物學現象上升為「一個具有細分功能的研究領域」。本文介紹了表觀遺傳學的發展歷程——從其歷史起源到當下的「表觀遺傳研究的現代時期(the modern era of epigenetic research)」。文中重點強調了表觀遺傳調控中的關鍵分子機制和概念進展,這些進展改變了我們對正常與受擾情況下生物發育的理解。

1. 導語

1942 年,Conrad Waddington 創造出了「表觀遺傳學」一詞,用以定義基因型未發生改變而表型改變的現象,以解釋發育的各個方面。大約 3/4 個世紀以後,我們發現基因表達模式傳遞的表觀遺傳機制並不依賴於 DNA 序列的改變,而是通過改變染色質的狀態,而染色質狀態同時是我們遺傳信息的生理學形式。除了 DNA,表觀遺傳機制同樣能夠穩定基因表達程序從而確定細胞的類型。人們早已認識到表觀遺傳調控的重要性,但是對於何種染色質狀態激活基因表達,何種染色質狀態抑制基因表達(編者註:染色質狀態像酶一樣可調控基因表達,即染色質狀態具有酶活性),所知依然甚少。

染色質免疫共沉澱測序(ChIP-seq)及其衍生技術使得人們能夠在鹼基解析度或者接近鹼基解析度水平上分析表觀基因組,同時也可以在正常或非正常的細胞或組織中構建表觀基因組圖譜。在一些情況下,表觀基因組圖譜能夠更好地定義基因增強子和啟動子等基因關鍵調控元件;其與 DNA 序列整合分析時,可深入探究疾病進程的分子機制。絕大多數已知的表觀遺傳修飾都是可逆的,如果對錶觀遺傳調控的這種適應性特性加以借鑒,那麼從表觀遺傳角度開發新的治療策略將大有希望。表觀遺傳學已然並將繼續成為現代生物學和醫學最具創新性的研究領域之一。

在文中,作者回顧了表觀遺傳學從其起源至「表觀遺傳研究的現代時期(the modern era of epigenetic research)」的發展歷程,作者將「表觀遺傳研究的現代」定義為 1996 至 2016 這二十年間的表觀遺傳學研究。本文介紹了關於染色質狀態酶活性定義的開創性發現,這種染色質狀態包括基因處於活性狀態的常染色質(euchromatin)和基因處於抑制狀態的異染色質(heterochromatin);此外,還介紹了表觀遺傳學在染色質穩定性、基因調控、轉錄沉默以及組蛋白修飾和 DNA 甲基化的可逆性等方面的機制進展。這些機制上的見解反過來加深了我們對於細胞身份的理解,同時也為重編程、染色質對環境的響應、表觀遺傳治療以及染色質遺傳等方面的研究開闢了新的途徑,作者對這些方面的進展也進行了概述。此外,作者描述了許多突破性的發現,重點描述了一些重要的機制和概念上的進展。文中引用了許多具有深遠影響的文章,但讀者有時也可參考《表觀遺傳學》教科書(Epigenetics, 2nd edition, CSHL Press)或者其他近期的綜述以獲取更為深入的討論和更多的參考內容。

2. 表觀遺傳學的基礎

Miescher、Flemming、Kossel 和 Heitz 在 1869 年到 1928 年間開展的開拓性工作定義了核酸、染色質和組蛋白,這也使得常染色質和異染色質在細胞學上產生了區別(圖1)。之後,Muller(在黑腹果蠅中)和 McClintock(在玉米中)在位置效應花斑(position-effect variegation,PEV)和轉座元件上的開創性研究,為非孟德爾遺傳(non-Mendelian inheritance)提供了早期的線索。進一步地,對X染色體失活以及基因組印記現象的描述催生了這樣一個基本概念的產生,即在同一細胞核中,相同的遺傳物質可以保持不同的「開」或「關」的狀態,但其背後的機制所知甚少。

圖 1. 細胞學上可見的活性染色質(常染色質)和抑制性染色質(異染色質)狀態。圖中顯示了兩個來源於雄鼠體細胞的處於細胞間期的細胞核,左邊的細胞核中的 DNA 呈現出廣闊的非緻密的染色,而右邊的細胞核呈現出具有典型的異染色質核(黑色的點),而且通過 DAPI 染色,AT 富集的重複序列可見。此外,在覈周圍的緻密染色的 Barr 體(一個失活的 X 染色體)被單獨標註出來。

2.1 DNA 甲基化

早在 1948 年,DNA 鹼基的化學修飾就已被檢測到(編者註:這早於1953年DNA雙螺旋結構的發現);在 20 世紀 70 年代中期,Holiday 和 Pugh 就提出了 DNA 甲基化(特別是 5-甲基胞嘧啶)在基因調控中的作用。到了 1980 年,DNA 甲基化和基因抑制的聯繫被建立,同一時期也發現了 CpG 島。5-氮雜胞苷(也稱為 2-脫氧-5-氮雜胞苷,後稱為地西他濱)是第一種「表觀遺傳藥物」,它能夠阻斷 DNA 甲基化,用於改變成纖維細胞系的基因表達和表型。此後不久, Feinberg 和 Vogelstein 報道了癌症中全基因組 DNA 低甲基化;十年後,腫瘤抑制基因的局部 DNA 高甲基化也被報道出來。這些發現為 DNA 甲基化的「酶學」理論(enzymology of DNA methylation)提供了令人信服的證據。小鼠 DNA 甲基化轉移酶1(DNMT1)的成功純化與克隆,以及 Dnmt1 突變小鼠的構建和分析向著這一理論邁出了重大一步。同一時期,第一個 DNA 甲基結合蛋白 MeCP2 被鑒定出來。時至今日,DNA 甲基化和 5-甲基胞嘧啶(被認為是「第五個鹼基」)已經被確立為許多生物體內關鍵的表觀遺傳學機制。

2.2 核小體

許多研究組的工作共同構建了核小體組織模型。1974 年染色質亞單元模型(chromatin subunit model)首次被清楚闡明,1997 年通過組蛋白八聚體-DNA 顆粒的 X 射線晶體結構,該模型首次被觀測到。正如當時觀測到的,染色質纖維的基本單位為核小體核心顆粒,它是由四個組蛋白的各兩個拷貝(組蛋白八聚體)組成的,並包裹了 147bp 的 DNA。

2.3 組蛋白修飾

在 20 世紀 60 年代中期,Allfrey 在組蛋白修飾(尤其是組蛋白乙醯化)方面的開創性工作引出了一種假設:乙醯化與基因活性密切相關。隨後科學家們進行了許多研究,Grunstein 等研究了釀酒酵母中組蛋白尾部的突變,發現這些突變擾亂了端粒和交配型基因座(mating-type loci)中基因的沉默。這項開創性的工作提供了功能方面的早期證據,其中就包括沉默信息調節蛋白(silent information regulator proteins)的首次表徵。由 Turner 等人開發的針對特定修飾或位點的抗體(如組蛋白 H4 第 16 位賴氨酸的乙醯化,H4K16ac)揭示了組蛋白乙醯化的非隨機模式,例如雌性哺乳動物中失活的 X 染色體和酵母中沉默的交配型基因的低乙醯化,以及黑腹雄性果蠅中上調兩倍的 X 染色體基因或雞紅細胞中表達的 β-珠蛋白基因的高度乙醯化。

從這些重大發現可以提出一個令人信服的論點:除了 DNA 甲基化外,組蛋白修飾還攜帶了能夠區分常染色質和異染色質的信息。果蠅、酵母和植物中強大的遺傳篩選體系已經鑒定了染色質依賴性的基因調控的其他關鍵因素,如 HP1、Su(var)3-9、Enhancer of zeste (E(z))、Polycomb、Trithorax、Clr4 和 DDM1 等。 然而,這些染色質因子的分子功能以及染色質是如何在常染色和異染色狀態之間「轉換」的還並不清楚。

3. 染色質狀態的酶學定義

3.1 基因活性和常染色質

1996 年,Allis 及其同事使用纖毛原生動物模型——嗜熱四膜蟲,將生物化學方法與凝膠內實驗(in-gel assay)相結合,從該生物體內具有活性的細胞核中純化和克隆出第一個編碼與轉錄相關的組蛋白乙醯基轉移酶(histone acetyltransferase,HAT)基因。引人注目的是,纖毛蟲中這種 HAT(p55)與此前描述的來自芽殖酵母的轉錄共激活因子 Gcn5 是直系同源物,這一發現為組蛋白乙醯化和基因活性之間提供了直接的聯繫,而且酵母 Gcn5 酶也顯示出 HAT 活性。有趣的是, 纖毛蟲的酶包含了在其他乙醯基轉移酶(如酵母的 Hat1)中發現的活性位點殘基以及高度保守的溴結構域(bromodomain),這提示它可能指導染色質招募,但機制至今尚不清楚。在隨後的研究中 Allis 團隊提供了通過 Gcn5 靶向組蛋白乙醯化導致基因激活的確鑿證據。一些其他的 HAT,包括 TAF1(也稱為 TAF(II)250)、PCAF 和 CBP / p300 也被鑒定出來,從而證實這一調控範式,並進一步將這一範式擴展到哺乳動物細胞中。

在 p55-Gcn5 結果發表後大約一個月,Schreiber 及其同事利用 HDAC 抑製劑 trapoxin,純化和克隆了第一個組蛋白去乙醯化酶(histone deacetylase,HDAC)。值得注意的是,研究人員發現哺乳動物中與 trapoxin 結合的蛋白質是芽殖酵母轉錄共抑制子 Rpd3 的直系同源物。這一具有里程碑意義的發現表明,組蛋白去乙醯化與轉錄抑制有關。總而言之,1996 年 HAT 和 HDAC 的工作給出了令人信服的接連衝擊(one–two punch),即組蛋白乙醯化和去乙醯化直接與基因調控的「開啟」和「關閉」狀態相關聯,這也正如 Allfrey 當初預想的那樣。

圖 2. 染色質狀態的酶活定義,包括 p55 催化的組蛋白乙醯化刺激基因激活或 SUV39H1 催化的組蛋白甲基化抑制基因活性。1996 年,嗜熱四膜蟲中組蛋白乙醯基轉移酶p55被鑒定為轉錄共激活因子,可以催化組蛋白 H3 乙醯化。H3K14ac 為溴結構域蛋白提供了停靠位點,進一步刺激核小體的可及性以及轉錄活性。組蛋白乙醯化可以被 HDAC 去除,進而造成轉錄抑制。2000 年,人類組蛋白賴氨酸甲基轉移酶 SUV39H1 被鑒定為果蠅中 Su(var) 的同源類似物,可甲基化組蛋白 H3 的 N-端尾巴。H3K9me3 為染色質域(chromodomain)蛋白 HP1 提供了停靠位點,隨後損害了染色質的可及性並誘導基因抑制。在當時,這種組蛋白甲基化是否可逆還不清楚。

HAT 和 HDAC 的開創性發現使得人們猜想,是否還存在其他具有類似活性的蛋白。2000 年,Guarente 和同事證明,酵母中基因沉默所需的關鍵蛋白 Sir2 是一種依賴於煙醯胺腺嘌呤二核苷酸(NAD)的 HDAC。隨後,研究人員在哺乳動物細胞中鑒定出 7 種類似 Sir2 的酶,現在稱之為 Sirtuin 蛋白家族。與其他 HDAC 相比,除了具有獨特的輔助因子和催化需求外,Sir2 相關的 HDAC 在新陳代謝和衰老方面的作用也引起了科學家們濃厚的興趣。

雖然取得了一些顯著的進展,但組蛋白乙醯化誘導形成活性染色質狀態的機制仍然未知。長期以來人們認為,組蛋白乙醯化通過中和組蛋白中的基本電荷,減弱與 DNA 的相互作用(順式效應),進而調節染色質結構和基因活性。1999 年,Zhou 和同事發現,PCAF 的溴結構域可作為乙醯基-賴氨酸結合模塊,用於對接乙醯化組蛋白。這是本文將要描述的第一個組蛋白修飾結合結構域,它揭示了含溴結構域的因子與染色質中乙醯化靶標結合的新機制(反式效應)(圖 2)。截止目前,已經鑒定了多種染色質結合模塊以及它們同源的組蛋白配體。

3.2 基因抑制和異染色質

Reuter 鑒定果蠅的 PEV(Position-Effect Variegation, 位置效應花斑,在某些細胞中由於染色體重排或轉座使某些基因移到異染色體的附近而不能表達,從而形成花斑的現象)修飾因子,其含有一個進化保守的 SET 結構域;而 Jenuwein 克隆和表徵了其在哺乳動物中的同源類似物。第一個組蛋白賴氨酸甲基轉移酶(KMT)將這兩個發現聯繫了起來。SET 結構域存在於 Su(var)3-9、E(z) 和 Trithorax 蛋白中,這些蛋白都與表觀遺傳調控有關,但是缺乏酶活性相關的證據。Jenuwein 預測了 SET 結構域的催化活性,然而,要揭示 SET 結構域與甲基轉移酶的遠距離關係還需要更精細的生物信息學分析。而研究發現,SUV39H1(Su(var)3–9 同源類似物 1)介導的組蛋白H3磷酸化與基因調控有關,這一發現啟發了一個關鍵的實驗:檢測重組的 SUV39H1 的組蛋白賴氨酸甲基轉移酶活性。該體外實驗揭示了重組 SUV39H1 的 SET 結構域對組蛋白 H3 強烈的催化活性。隨後,Jenuwein 和 Allis 實驗室合作研究表明,SUV39H1 選擇性地甲基化組蛋白 H3 第 9 位賴氨酸(形成 H3K9me3);這是表觀遺傳魔法(epigenetic 『magic』)卓有成效的案例,因為 Su(var)3-9 基因的遺傳分類顯然預測了酶的底物和位點特異性。2000 年,Jenuwein 發表文章,鑒定了第一個組蛋白賴氨酸甲基轉移酶 SUV39H1。

SUV39H1 發現後不久,就發現 HP1 的染色質域(chromodomain)可以與甲基化的 H3K9 結合,正如裂殖酵母中 HP1 相關的蛋白 Swi6 一樣。綜上所述,這些發現為自 1928 年以來一直空缺的異染色質的形成和傳播提供了生化解釋,並鑒定了自 20 世紀 60 年代以來一直令人費解的組蛋白賴氨酸甲基化的酶類。非常重要的是,負責基因抑制和異染色質組裝的 SUV39H1-HP1-H3K9me 系統比 DNA 甲基化更為保守,它們存在於單細胞生物(例如裂殖酵母)、植物和無脊椎動物(例如果蠅)以及複雜的多細胞生物(哺乳動物和人類)中。

SUV39H1 的 SET 結構域提供了一個標誌性的催化域,大量含有 SET 結構域的蛋白作為潛在的 KMT 被檢測。在哺乳動物基因組中發現了大約 50 個編碼含有 SET 結構域蛋白的基因,其中許多蛋白得到了深入研究。組蛋白賴氨酸甲基化既可能發揮抑制作用,如 SUV39H1 介導的 H3K9me3,也可發揮激活作用,如 H3K4 甲基化。其他研究組在哺乳動物中鑒定了受發育調控的沉默或激活的染色質狀態(如 G9a 催化的 H3K9me2,EZH2 催化的 H3K27me3,Trithorax 和 MLL 催化的 H3K4me3),以及失活的 X 染色體的抑制性染色質結構。此外,還鑒定了不包含 SET 結構域的 KMT,它們可以甲基化組蛋白核心區域(非尾巴)位點(如 DOT1L 甲基化 H3K79)。除了組蛋白賴氨酸甲基化外,組蛋白精氨酸甲基化也與基因調控有關,如共激活子 CARM1 或 PRMT1 可以通過 H3R17 或 H4R3 甲基化介導依賴於激素的轉錄刺激。

顯然,組蛋白修飾對於依賴於染色質的基因調控至關重要。然而,在當時組蛋白賴氨酸甲基化是否像組蛋白乙醯化一樣是可逆的仍然是一個關鍵問題,這有待更深入的研究。

4. 表觀遺傳研究的現代時期

可以認為,上述研究,再加上全基因組染色質圖譜等新技術的發展,開闢了我們所說的「表觀遺傳學現代研究」,自 2000 年以來該領域的大量出版物也證明瞭這一點。新的會議和倡議推動了世界範圍內對錶觀遺傳控制的本質機制深入研究的浪潮。典型的例子包括由冷泉港實驗室、美國癌症研究協會(AACR)、戈登研究會議(GRC)組織、美國實驗生物學協會聯合會(FASEB)和 Keystone 專題研討會等機構組織的專門致力於表觀遺傳學的會議。此外,還成立了幾個大型聯盟,如歐洲的卓越的「表觀基因組」和「表觀基因系統」網路(The Networks of Excellence 『The Epigenome』 and 『EpiGeneSys』)、美國國立衛生研究院(NIH)的表觀基因組計劃路線圖(Roadmap Epigenomics Project)和 ENCODE 計劃,以及國際人類表觀基因組聯盟(IHEC),這些聯盟將歐洲、美國、加拿大、亞洲等地的科學家緊密聯繫起來。

下面本文將描述 2000 年至 2016 年間的重大突破性發現。這些發現在圖 3 中是按時間順序排列的,我們並不總是按照嚴格的順序來展示它們,而是將它們歸類為連貫的機制和概念上的進展。

圖 3. 1996~2006 年間表觀遺傳研究領域重要發現和進展的時間線

4.1 組蛋白密碼假說及相關理論

越來越多的組蛋白共價修飾表明核小體攜帶表觀遺傳信息,然而這種信息是否由順式或反式的機制介導尚不清楚。1999 年 Zhou 和他的同事發現了結合乙醯化賴氨酸的溴結構域,為一年後提出的一個有影響力的假說——「組蛋白密碼假說(histone code hypothesis)」提供了第一條實驗證據。「組蛋白密碼假說」認為,組蛋白修飾的組合模式導致了不同的生物學結果,部分通過反式招募下游效應蛋白(稱為「閱讀者」,以匹配組蛋白修飾酶的「書寫者」)或複合物。「組蛋白密碼假說」預測,此後還會鑒定其他組蛋白修飾的閱讀者。事實上,很多種類型的組蛋白結合模塊已經被鑒定(例如染色質域、tudor 域和 PHD 指結構域),其結構深入闡明瞭它們與相應配體結合的特異性,這又進一步拓展了「組蛋白密碼假說」,包括將其翻譯成更廣泛的「表觀遺傳密碼(epigenetic code)」。這些假說的其他後續拓展包括組蛋白盒(histone cassettes),二元開關(binary switches)和效應子-配體結合反應的多價性(multivalency)。儘管科學界質疑組蛋白修飾的共價「語言」是否滿足成為真正「密碼」的標準,但毫無爭議的是,除了順式機制(電荷效應),效應蛋白結合的反式機制在組蛋白和 DNA 修飾讀取中發揮重要作用。

4.2 組蛋白修飾和 DNA 甲基化

組蛋白修飾的組合特性也不禁讓人們好奇:組蛋白修飾與 DNA 甲基化是否在功能上存在聯繫。MeCP2 與 HDAC、轉錄共抑制因子 SIN3A 相互作用,引發轉錄抑制。Selker 及其同事利用真菌模型粗糙鏈孢黴提供了令人信服的證據:組蛋白 H3K9 甲基化(由 DIM5 催化)是 DNA 甲基化所需要的。隨後在植物中的研究進一步支持了這些發現,其中 H3K9 甲基轉移酶 KRYPTONITE 控制 DNA 甲基化。此時,H3K9 甲基化作為 DNMT 染色質甲基化酶(chromomethylase)的停靠位點,進而抑制沉默重複元件。多結構域蛋白,如 UHRF1(也稱為 Np95)可以連接 H3K9 甲基化和半甲基化 DNA,以穩定 DNMT1。催化失活的 DNMT3 樣銜接子(DNMT3-like adaptor)通過其 ADD 結構域選擇性地結合未修飾的 H3K4,一旦 H3K4 被甲基化為 H3K4me3,這種選擇性結合就被阻斷。

對於發育控制的基因表達和多梳蛋白複合物介導的沉默而言,組蛋白修飾和 DNA 甲基化之間的相互依賴揭示了它們之間複雜的關係。然而,不同的 DNA 序列是否可以指導 DNA 甲基化的存在與否仍然不清楚。2010 年突破性地發現, CpG 島對轉錄因子具有親和力,例如 CXXC 型鋅指蛋白1(CFP1),它可以募集活化的 KMT 並阻止 DNA 甲基化。因此,富含 CpG 的 DNA 可以靶向活性染色質結構並保護其免於從頭 DNA 甲基化,即使在轉錄暫停或中止情況下也是如此。低、中、高水平 CpG 的 DNA 甲基化的差異也可以解釋不同的轉錄因子是否可以進入其同源結合位點。

4.3 非編碼 RNA 和基因轉錄沉默

儘管在組蛋白和 DNA 修飾方面取得了顯著進展,但對於這些標記是如何被添加到特定的基因組位置還知之甚少。研究發現小 RNA 可作為潛在「模板」分子,這為該問題提供了部分解答。在 2002 年,四個研究組使用裂殖酵母(Grewal 和 Martienssen)和四膜蟲(Allis 和 Gorovsky)模型,報道了小 RNA 與基因組特定位點相互作用,並可能指導基因組特定位點的染色質修飾活性。在細胞質中,小RNA阻斷信息翻譯從而抑制基因表達,這一過程稱為 RNA 介導的幹擾(RNAi)或轉錄後基因沉默(PTGS);而在細胞核中,這些小核 RNA 介導了 「基因轉錄沉默(transcriptional gene silencing,TGS)」過程,不僅指導了裂殖酵母中的異染色質組裝和基因沉默,還指導了嗜熱菌的程序化 DNA 消除。在這兩個模型中,小 RNA 與組蛋白賴氨酸甲基化複合物的已知組分相互作用,這使得人們懷疑這些系統進化是為了保護基因組免受有害 DNA 元件或病毒的侵害;因為如果沒有適當的沉默機制,這些有害的 DNA 元件或病毒可能會破壞基因組。在該模型的擴展中,非編碼 RNA(ncRNA)的轉錄通常被認為是一種全基因組的監控機制,在 RNA 質量控制中發揮著重要作用。

儘管這些途徑中不同分子步驟的順序仍不清楚,但這些發現強調了 DNA、RNA 和組蛋白及其修飾以協同方式發揮作用,以產生對發揮基因功能很重要的染色質狀態。TGS 途徑代表了 RNA 介導的異染色質化機制中的一種序列互補機制,其中 RNA 信號回到 DNA 並建立抑制性的染色質狀態,而且可以在許多細胞分裂中傳遞下去。

4.4 核小體重塑和組蛋白變體

ATP 依賴的染色質重塑複合物為改變組蛋白-DNA 接觸、促進 DNA 可及性以及新舊組蛋白的交換或轉錄因子進出染色質提供了另一種重要機制。在 1992-1998 年期間,遺傳和生化研究鑒定了 SWI/SNF、NURF 和其他 ATP 依賴的核小體重塑複合物,並對它們的作用機制提供了早期的闡述,而這正是目前非常活躍的表觀遺傳學研究領域。癌症中人 BAF 重塑複合物組分的高頻突變進一步刺激人們的研究熱情。

組蛋白變體,與其主要的經典組蛋白僅有少量氨基酸的差異,起初人們認為它們與經典組蛋白在氨基酸序列上過於相似,差異太過微小,因而並不重要。當研究聚焦於黑腹果蠅組織培養細胞中的 H3 變體(H3.3)時,發現 H3.3 可獨立於 DNA 複製而放置入染色質中,並優先靶向轉錄活躍的染色質。此後不久,生化方法記錄了一個 H3.3 選擇性伴侶(HIRA),它不同於在 S 期執行的 H3(H3.1 和 H3.2)置入系統(染色質組裝因子 1,CAF1)。組蛋白變體進出染色質的快速交換,這一過程由專門的分子機器介導,這種分子機器可以識別特定的組蛋白變體,這種現象支持了這樣的理論:組蛋白變體是染色質纖維變異的主要機制。甚至著絲粒染色質也有其特異的 H3 變體(在哺乳動物中被稱為著絲粒蛋白 A,即 CENP-A),越來越多的證據表明,CENP-A 標記了具有自身表觀遺傳身份的著絲粒。其他非 H3 組蛋白變體也引起了相當大的關注,例如, H2A.X,當其磷酸化時,顯著標記染色質中 DNA 雙鏈的斷裂; H2A.Z,一種富集在轉錄起始位點的變體,該位點與 5mC 呈反相關;macroH2A,一種富集在無活性X染色體上長的 H2A 亞型。顯然,染色質介導的表觀遺傳調控的難題有很多,但組蛋白變體表明,即使是一些最小的一個也至關重要。

圖 4. 染色質促進表觀基因組功能的關鍵案例

4.5 所有染色質標記都是可逆的

組蛋白的「擦除者」因組蛋白乙醯化(去乙醯化酶)和磷酸化(磷酸酶)而為人所知,這是兩種主要的組蛋白修飾,它們具有良好的周轉特性,可動態響應細胞的轉錄需求。相比之下,組蛋白甲基化的擦除者並不為人所知,這使得它很可能成為「永久性的」組蛋白標記——也就是說,可能不具有酶促可逆性。這是一個有吸引力的概念:如果組蛋白甲基化標記是穩定的表觀遺傳標記,它們可能具有遺傳潛力。2004 年,Shi 和同事打破了這個概念,他們發現並鑒定了第一個組蛋白賴氨酸去甲基化酶(KDM)——LSD1(賴氨酸特異性去甲基化酶 1),一個核 FAD 依賴的胺氧化酶同源物。但是,LSD1 不能使組蛋白賴氨酸三甲基去甲基化,表明賴氨酸三甲基化可能是一個永久性的表觀遺傳標記。然而,不久之後,Zhang 和同事通過在該領域引入第二類賴氨酸去甲基化酶—— Fe(II)和 α-酮戊二酸依賴的含有 Jumonji 結構域的雙加氧酶,進而反駁了這一觀點。這類酶能夠去除組蛋白中的三甲基-賴氨酸標記,從而支持所有表觀遺傳標記都可能是可逆的這一普遍觀點。與其他擦除者一樣,KDM 表現出了顯著的底物和位點特異性,KDM 研究迅速發展成為具有重要催化和調節功能的表觀遺傳調控物質。

從歷史角度看,對於 DNA 甲基化的可逆性這一基本問題,特別是對於 5mC 的丟失,也存在相當大的困惑。長期以來發育生物學家描述了在生殖細胞成熟和早期胚胎髮生過程中出現的兩波全基因組 DNA 去甲基化浪潮;然而,DNA 甲基化去除過程長期以來一直難以捉摸,因此研究認為,DNA 甲基化去除是被動過程(通過 DNA 複製稀釋),而非主動過程(酶促驅動)。5-羥甲基胞嘧啶(5hmC)的鑒定為解答這個難題提供了關鍵一環。重要的是,Rao 和 Zhang 的研究鑒定了一個新的 TET1-3 酶家族,它們能夠將 5mC 氧化為 5hmC,還可以進一步氧化為 5-甲醯基胞嘧啶(5fC)和 5-羧基胞嘧啶(5caC)。隨後可以通過 DNA 糖基化酶對這些修飾鹼基進行酶促切除,從而產生完全去甲基化的 DNA 模板。與組蛋白甲基化一樣,DNA 甲基化也具有豐富的書寫者、閱讀者和擦除者。顯然,DNA 共價修飾「語言」的複雜性與組蛋白的複雜性一樣在增加。

4.6 二價染色質(bivalent chromatin)和表觀基因組特徵

到 2005 年,組蛋白乙醯化、磷酸化和甲基化等標記作為一組受到廣泛研究的組蛋白修飾脫穎而出。質譜等敏感方法持續揭示出數量驚人的組蛋白修飾,儘管其中許多修飾的數量並沒有主要標記那麼豐富。相應地,修飾選擇性抗體也被開發出來,並經常被用於 ChIP 分析,用來檢測你最感興趣的基因。幾個有遠見的實驗室採用了一種不同的、強大的方法,開發了全基因組 ChIP 的衍生方法,在正常和異常狀態下更廣泛地剖析表觀遺傳景觀。該方法的早期版本將H3K4me2(作為染色質「開」的標記)與 H3K9me2(作為染色質「關」的標記)進行了比較,結果既豐富又引人注目,發現這些標記間具有顯著的負相關性。藉助 ChIP-seq 將這些研究可以很好地擴展到胚胎幹細胞(ES)中,部分原因是由於 ES 細胞具有被誘導進入特定分化途徑的能力。不久,組蛋白標記的一致模式出現了。例如,H3K4me3 與活性啟動子元件相關,而 H3K27me3 則富集於發育控制的抑制性染色質狀態中。這些有指導意義的表觀基因組「特徵」開始出現,引起了人們對今天仍在使用的全基因組方法的興趣。

然而,在 2006 年,對組蛋白標記來說,這種具有吸引力的開關邏輯被證明過於簡單。Lander 和 Fisher 里程碑式的研究意外地發現,胚胎幹細胞中存在同時具有激活和抑制標記的,處於發育「蓄勢待發的(poised)」基因。H3K4me3 和 H3K27me3 重疊的模式被稱為「二價染色質(bivalent chromatin)」。「蓄勢待發的(poised)」基因的二價特徵的發現是出乎意料且非常重要的。它提供了第一個關於「中間」狀態的線索,其中二價標記的基因可以在發育過程中分解為活性或非活性狀態。二價染色質不是胚胎幹細胞特異性的,在其他細胞類型中也有詳細的記錄。

如何在覈小體水平上建立和組織二價染色質仍然是一個重要的問題。相反的 H3K4me3 和 H3K27me3 是標記在同一個H3尾部還是不同 H3 尾部,是同一個核小體內或相鄰核小體上的?由 Reinberg 牽頭的研究表明,H3K4me3 和 H3K27me3 標記並不是存在於同一個H3尾部,這導致了核小體內的不對稱分佈。這種排列對二價結構域的建立和傳播有影響。

不出所料,這種複雜性在一定程度上有助於微調染色質中其他基因順式調控元件的標記。細胞類型特異性的「活性」增強子通常由一組表觀遺傳標記來定義,如 H3K4me1 和 H3K27ac。因此,當在基因組水平上分析組蛋白修飾時,發現了可複製的模式,從而可以預測哪些遺傳元件是有功能的(稱為表觀基因組分析)。將染色質改變(核心組蛋白修飾和 DNA 甲基化的集合)與核小體位置和轉錄因子結合位點共定位,並與基因組的總 RNA 輸出整合。具有指導意義的組蛋白修飾模式——如增強子區的 H3K4me1和 H3K27ac,啟動子區的 H3K4me3,轉錄區的 H3K36me3,Polycomb 介導的抑制區域中的 H3K27me3 和異染色質區的 H3K9me3,已被 NIH 路線圖表觀基因組學聯盟(Roadmap Epigenomics Consortium)和 IHEC 用於簡要描述參考表觀基因組並比較正常和疾病細胞狀態的表觀基因組特徵。現在,技術的新進步使得對單細胞表觀基因組的分析更加精確,其對細胞譜系維持的貢獻也有了新的認識。單細胞轉錄組進一步拓展,已經揭示了幾乎整個基因組都被轉錄,從而產生一系列具有不同調節功能的 ncRNAs,這些 ncRNAs 可能在表觀遺傳景觀方面發揮重要作用,目前仍在積極研究中。

5. 發育與疾病

從上述許多突破性的發現和概念上的進展來看,湧現出了表觀遺傳控制的分子標誌(molecular hallmarks of epigenetic control),其對於細胞身份和細胞重編程非常重要。最重要的是,這些標誌響應發育和環境變化,並且可能會被染色質修飾酶的化學抑制和修飾閱讀蛋白所逆轉。表觀遺傳響應(epigenetic response)的許多方面——例如,不同飲食的代謝波動、晝夜節律、衰老以及從同一基因組模板表現出表型多樣性(例如基因組印記和雙胞胎研究)最近已得到綜述,這些超出了本文的範圍。在這裡,我們關注表觀遺傳控制的分子標誌在發育(例如重編程)以及正在治療或已被證明對錶觀遺傳治療有響應的人類疾病的一些關鍵例子(例如癌症、炎症和免疫反應)中的作用。

5.1 重編程的表觀遺傳障礙

表觀遺傳控制對細胞類型特性和細胞重編程至關重要。Weintraub 及其同事的開創性實驗表明,順式作用轉錄因子 MyoD——一種對肌肉分化至關重要的因子,可以重編程成纖維細胞。20 年後,當 Yamanaka 和他的同事們使「時光倒流」時,這種邏輯重新浮出水面,為 Gurdon、Briggs 和其他人經典的細胞核重編程實驗提供了開創性的機制見解。他們開創性的研究表明,在分化成體成纖維細胞中表達的一小部分特定轉錄因子(現在稱為「Yamanaka 因子」,包括 Sox2、Oct3/4、Klf4 和 c-Myc)將誘導產生多能性,從而產生誘導多能幹細胞(iPS 細胞)。

從成體組織中重新編程體細胞的潛力對再生醫學具有令人興奮的意義,儘管誘導多能幹細胞的過程效率低下,且尚未準備好用於人類。染色質狀態在多大程度上阻礙體細胞重編程的能力呢?通過阻斷 H3K9me3 的 KMT 或用維生素 C 刺激 Jumonji 組蛋白賴氨酸去甲基化酶和 TET 酶,可提高重編程效率,這表明異染色質可能是一個障礙,至少在一定程度上,導致了這些重編程事件的低效率。為了支持這一觀點,已經鑒別了「先驅」轉錄因子(pioneer transcription factors),它們能夠結合到抑制性染色質區域,招募輔助因子和染色質調控因子,這些輔助因子和染色質調控因子能夠誘導下游基因調控級聯反應,而這種級聯反應可以克服抑制性染色質狀態。一般認為譜系可塑性(細胞身份的變化)具有表觀遺傳學基礎,可能在重編程中發揮重要作用,研究觀察到了染色質修飾酶表達水平變化和改變表觀遺傳機器的輔助因子的波動,這些為上述觀點提供了支持,並會導致細胞命運的轉變。

圖 5. 表觀遺傳控制的分子標籤以及它們醫學相關性的案例,還有可能的治療策略

5.2 癌症和表觀遺傳治療

上面提到的大多數突破性發現的動機,並不需要與疾病產生明確的聯繫。癌症研究通常聚焦於腫瘤發生過程中的基因變異(如突變、基因重排和拷貝數變異),使得大多數癌症顯示出明確的「標籤」。早期,人們發現異常的表觀遺傳特徵(例如 DNA甲基化)在癌症中具有潛在的臨牀重要性,為推進表觀遺傳治療提供了強大動力。Jones 和 Baylin 應用 DNA 甲基化的化學抑製劑(DNMTi)重新激活異常沉默的腫瘤抑制基因,同時還使用 HDACi,例如由 Yoshida 開發的 TSA(曲古抑菌素 A)和 trapoxin,隨後使用由 Marks 臨牀應用的 SAHA(辛二醯苯胺異羥肟酸,也稱為伏立諾他),為表觀遺傳學這一激動人心的領域鋪平了道路。

2006 年,隨著美國食品和藥物管理局(FDA)批准的第一批表觀遺傳藥物(地西他濱和伏立諾他)用於人類癌症的治療,這些概念變成了現實。逆轉癌症患者的表觀遺傳錯誤為表觀遺傳學的重要性提供了最有說服力的論據之一。一種以表觀遺傳學為中心、以試劑為基礎的生物技術公司產業正在興起。甚至大型製藥公司也開始採取行動,他們普遍認為,與基因改變不同,表觀遺傳特徵中的錯誤將是可逆的。用 DNMTi 和 HDACi 治療可以獲得有希望的臨牀結果,我們從中獲得啟發,即其他類型的「書寫者」和「擦除者」也可能成為有價值的藥物靶點。此外,耐葯癌細胞可以對 HDACi 和去除 KDM 的聯合療法產生響應,這種聯合療法切斷了癌細胞的存活通路,並誘導更高水平的 DNA 損傷。一般認為,癌症細胞可能有更脆弱的染色質和更高的「表觀遺傳雜訊(epigenetic noise)」,這種概念可以解釋為什麼它們更容易響應選擇性的殺傷治療(通過表觀遺傳抑製劑與放療結合)。

儘管迅速湧現的文獻提供了表觀遺傳學和其他非癌症疾病之間的大量聯繫,但是癌症仍然是可能響應表觀遺傳學治療的最有說服力的疾病。2012 年,某些類型的癌症甚至與組蛋白中的「驅動」突變有關,這類突變被稱為「原癌組蛋白(oncohistones)」。

組蛋白修飾酶,無論是閱讀者還是擦除者,都被證明是腫瘤學中具有潛力的藥物靶點。Bradner、Tarakhovskly 和 Kouzarides 團隊的研究為表觀遺傳靶點和療法添加了新的閱讀者。他們選定了一些含溴結構域的蛋白質,例如BET家族的成員,而且證明這些蛋白可作為小分子(例如抑製劑 JQ1 或 iBET)的成藥靶蛋白,這些小分子與乙醯賴氨酸結合口袋結合,以破壞關鍵蛋白質-組蛋白的相互作用。與 HAT 和 HDAC 的其他小分子抑製劑一樣,下游反應是非隨機的。例如,被這些小分子靶向的溴結構域蛋白之一BRD4研究得更為透徹,BRD4 反過來又參與轉錄延伸通路,這種通路對血癌中促進腫瘤的關鍵致癌基因(如 MYC)和促炎基因(如 NFKB)的表達非常關鍵。而現在,隨著溴結構域抑製劑的成功,其他染色質閱讀者也受到了極大的關注。

5.3 免疫防禦

在細胞譜系特化、對外界信號的響應和細胞記憶的誘導中,染色質介導的基因調控富集於免疫系統。造血細胞系的細胞通過改變染色質狀態整合信號,而且可以引起對激活狀態的「記憶」,正如巨噬細胞中那樣。炎症信號(例如脂多糖)引起促炎基因(例如 NFKB,其通常已經被 RNA 聚合酶II(Pol II)佔據)的轉錄激活,以實現快速響應。停滯不前的 RNA Pol II 的延伸被阻止,並需要 PCAF-HAT 延伸複合物,這是許多基因的特徵。NFKB 對 iBET 的選擇性響應是通過幹擾 PCAF 與促炎基因的結合來抑制炎症。

表觀遺傳控制對免疫細胞的激活也很重要,並可通過藥理學治療增強免疫反應。出乎意料的是,研究發現組蛋白甲基轉移酶 EZH2 通過甲基化細胞質的肌動蛋白而轉導 T 細胞活化,這為許多組蛋白修飾酶具有非組蛋白底物提供了典型的案例。此外,HDACi 可通過阻止活化誘導的細胞死亡(activation-induced cell death)來維持 T 細胞的活化。KMT G9a 的藥理學抑制和釋放的基因抑制導致幹擾素基因的激活,並導致對病原體的抗性增加。DNMTi 不僅影響腫瘤抑制基因,還影響那些對DNA甲基化降低做出響應的重複元件。用低劑量的 DNMTi 對幾種癌症進行治療,激活了內源性逆轉錄病毒,引起 dsRNA 介導的免疫反應,隨後這種免疫反應靶向腫瘤細胞。打破免疫耐受和增強免疫反應是對抗癌細胞的兩種主要機制。因為幾乎所有的組蛋白修飾酶也靶向許多非組蛋白蛋白(這是 Roeder 及其同事首次描述腫瘤抑制因子 p53 乙醯化時提出的概念),因此臨牀研究需要仔細使用和分析小分子抑製劑。具體而言,需要慎重考慮表觀遺傳治療在攻擊腫瘤細胞和不削弱防禦性的免疫細胞之間的平衡。

涉及非組蛋白蛋白(non-histone proteins)的翻譯後修飾的表觀遺傳控制進一步擴展了功能性染色質輸出的調節。例如,組蛋白中的不同修飾盒(modification cassettes),特別是 ARKS/T 型的修飾盒也存在於幾種非組蛋白的蛋白質中,並允許翻譯後修飾和識別者蛋白的識別。據報道,G9a 中的一個短的組蛋白模擬物(histone mimic)需要通過自甲基化(automethylation)來觸發其活性,從而產生組蛋白「擬態(mimicry)」的概念。流感病毒的非結構蛋白 1(NS1)含有一個氨基酸序列,該氨基酸序列與組蛋白 H3 的 N-端密切相關,可感應 H3K4 甲基化。NS1 中的 H3K4 樣甲基化會轉運 PCAF 並減弱抗病毒基因的轉錄。因此,「組蛋白擬態」被病原體衍生的蛋白用於抑制細胞防禦。這些激動人心的發現已經被正式提出,某些組蛋白肽模擬物具有發展成新型的表觀遺傳藥物的潛力。

5.4 染色質遺傳(記憶)

在表觀遺傳研究的激烈爭論中,一個核心問題是組蛋白及其修飾是否是表觀遺傳學信息的真正載體。與 DNA 甲基化或其他修飾不同,組蛋白遺傳的機制仍未得到解決,部分原因是長期以來關於組蛋白(舊與新)是如何在複製叉上分離的爭論。早期 Grewal 和 Klar 在裂殖酵母、Paro 及其同事在黑腹果蠅中的研究暗示染色質狀態轉換可能是可遺傳的。最近,Moazed 和 Allshire 團隊的研究表明,在缺乏順式作用的轉錄因子或結合 H3K9 的 DNA 序列的情況下,H3K9 甲基化可以被瞬時誘導並在多代中遺傳。重要的是,這種染色質遺傳需要缺失阻礙 H3K9 甲基化的拮抗因子。Strome 及其同事的類似發現揭示了在秀麗隱桿線蟲中 PRC2 介導 H3K27me3 的染色質遺傳。綜上所述,這些研究表明,至少在這些模型中,組蛋白可以傳遞它們的信息,儘管確切的分子機制正在積極研究中。為此,Reinberg、Gamblin 及其同事表明,抑制性組蛋白標記 H3K27me3 的傳播是通過其非催化亞基 EED 對 PRC2 複合物的正向變構調節引起的。這些關於 PRC2 的研究和新的結構工作非常重要,因為它們為染色質前饋環路(feed-forward loops)提供了生化證據,而前饋環路很可能有助於組蛋白修飾的遺傳。

這樣的結果是否可以推廣到表觀遺傳因子的多代遺傳,即跨代遺傳(transgenerational inheritance)這一普遍現象?事實上,果蠅和小鼠中的研究表明,飲食和其他環境因素的變化,特別是父親的飲食,可以傳遞給子代,並重新編程子代的代謝,從而導致世代的肥胖。和在裂殖酵母中的實驗一樣,組蛋白甲基化的改變似乎參與其中。由於組蛋白標記可以影響負責從頭 DNA 甲基化以及 ncRNA 表達的酶系統,因此其他更傳統的核酸模板機制也可能進入整體的表觀遺傳學遺傳程式。在植物中,「表觀遺傳控制者」——移動RNA,已被證明是表觀遺傳信息的載體,並且小 RNA 序列已被用於受精的小鼠卵母細胞的重編程。近期研究在精子中檢測到 ncRNA 和 tRNA 片段,這表明不僅只有 DNA 序列可以被遺傳。

6. 展望

在過去的 20 年裡,表觀遺傳調控的分子機制的解析取得了意想不到的進展,這對更好地理解正常發育以及人類疾病的治療具有深遠影響。在此,我們提倡對錶觀基因組特徵進行更精確的定義,借鑒單細胞分析的進展,但強調有必要區分表觀基因組改變的原因或結果。為此,我們將繼續使用 CRISPR-Cas9 基因編輯技術,以便對遺傳和表觀遺傳調控進行更全面的解析。染色質動力學不再被認為是一維或二維的問題,因為三維空間中的長期相互作用,產生了構建基因組的拓撲相關結構域(TAD)和其他染色質區域(chromatin territories),其有很好的文獻記載以及定義它們的新方法。此外,ncRNA在表觀遺傳調控的許多方面的重要性遠遠超出 RNAi 介導的 TGS 和 miRNA 依賴的 PTGS,並揭示了越來越多的染色質相關的 RNA(例如,lncRNAs、增強子 RNA 和重複 RNA),它們可以啟動和穩定不同的染色質狀態,甚至在具有相同DNA序列的等位基因中也是如此。事實上,RNA 被認為是表觀遺傳調控的「主要分子」之一,ncRNA 的重要功能在最近的綜述中已經被詳細闡述。

隨著更精準的抑製劑(如 HDACi、DNMTi、iBET 和去乙醯化酶抑製劑)的開發,對更複雜的人類疾病(如代謝和神經退行性疾病)和習以為常的功能(如學習和記憶)的探索性研究將揭示對錶觀遺傳聯合療法的響應。此外,新的實驗系統正被用來分析表觀遺傳學對羣居昆蟲行為和表型多態性的貢獻。特別是對於代謝紊亂和環境驅動的適應,染色質似乎是整合變化輸入的生理模板。鑒於 1996 年至 2016 年間取得的進展,我們預計會有更多的發現將繼續揭示染色質適應性是如何組織和顯露存儲在我們基因組中的信息的。

全文完。

編譯整理:楊智聰、劉夢醒、徐鵬

推薦閱讀:

相關文章