首頁>科學>

責編丨迦漵

作為表觀遺傳學修飾的重要成員,DNA甲基化廣泛存在於原核生物和真核生物併發揮重要的調控作用。原核生物中,胞嘧啶(Cytosine, C)的第四位氮元素可以被甲基化修飾形成N4-甲基胞嘧啶(4mC),第五位的碳元素可以被甲基化修飾形成C5-甲基胞嘧啶(5mC)。不同於原核生物,迄今為止,真核生物中沒有發現4mC,而5mC則普遍存在於真核生物的眾多物種。

在真核生物中,DNA甲基轉移酶DNMT1和DNMT3負責5mC的甲基化過程,並且在各物種中高度保守。在不同物種中,基因組範圍內的5mC分佈可以是遍在的也可能是有一定的選擇性的。在脊椎動物中,全基因組範圍內,只有CG (還有CHG和CHH兩種含有胞嘧啶的鹼基組成,H代表A或C或T)能被甲基化成5mCG,例如人體組織中有超過80%的CG都被甲基化為5mCG。而在開花植物中,5mC卻只發生在轉座子區(Transposon Elements, TE)和一少部分基因上,但卻不只存在於CG,還涵蓋CHG和CHH。在動植物的發育過程中,5mC的水平在很大程度上保持穩定,一旦紊亂會造成嚴重的發育異常和疾病,例如癌症。但值得注意的是,在哺乳動物和開花植物的雄性生殖細胞—精子的發育的過程中,5mC則會發生重程式設計(reprogramming)。這種5mC重程式設計對於精子發育至關重要。

近日,來自John Innes Centre的馮小琦課題組在預印本bioRxiv上post了題為Extensive N4 Cytosine Methylation is Essential for Marchantia Sperm Function的文章,文章首次發現了4mC在真核生物基因組中的存在並詳實證明了4mC參與調控精子發育和功能。

具體來說,作者發現4mC產生並存在於陸地植物地錢(Marchantia Polymorpha)的精子發育過程,由兩個前所未知的甲基轉移酶修飾。作者將這兩個真核生物中首次發現的4mC甲基轉移酶命名為Marchantia polymorpha DNA N4 CYTOSINE METHYLTRANSFERASE1a(MpDN4MT1a和MpDN4MT1b)。有趣的是,作者發現整個精子發育過程存在兩種DNA甲基化的重程式設計(DNA methylation reprogramming): 一種是CHG和CHH(non-CG)的5mC甲基化從早期只存在於轉座子區到全基因組範圍的擴張,和轉座子區的5mCG甲基化程度的加強,這個5mC的重程式設計過程由MpCMTa和MpDNMT3b甲基轉移酶參與調控;另一種是始於精子成熟期的,特異發生於基因區(genic region)的4mCG,這個4mC的重程式設計過程是由新發現的兩個在精子發育後期特異表達的甲基轉移酶MpDN4MT1a和MpDN4MT1b介導的。

作者發現,全基因組範圍內,相較於營養組織的低DNA甲基化水平(17%),成熟的精子具有近乎全基因組覆蓋的DNA甲基化程度(97%)。為了研究這一巨大的DNA甲基化變化過程和機理,作者分離了不同發育時期的精子前體細胞群,以進行轉錄組、甲基組和發育時期的同步分析。如下圖所示:

結果顯示,在精子發育過程中,除轉座子區外的基因組範圍內,有兩波(two waves)不同的DNA甲基化修飾的發生,第一波發生在non-CG上,而後第二波發生在CG上。這種全基因組的DNA甲基化修飾與精子的成熟過程高度相關,並且這種現象並不存在於受精後的胚胎。如下圖所示:

結合轉錄組和遺傳學分析,作者發現了兩個5mC甲基轉移酶(MpDNMT3b和MpCMTa)在精子發育過程中表達量升高,並進而確認了他們參與調控發生在non-CG的5mC甲基化的重程式設計(first wave,第一波),但不負責發生在CG上的重程式設計(second wave,第二波)。如下圖所示:

雖然沒有任何5mC甲基轉移酶的表達和第二波重程式設計相關,但令人興奮的是,作者發現了兩個全新的甲基轉移酶MpDN4MT1s。MpDN4MTs不與5mC甲基轉移酶同源,但和原核生物的4mC甲基轉移酶高度同源。他們在精子發育後期特異表達,暗示他們可能負責第二波發生在CG上的DNA甲基化重程式設計。如下圖所示:

因為經典的檢測DNA甲基化程度的重亞硫酸鹽測序(Bisulfite Sequencing,BS-seq)不能區別4mC和5mC,所以作者透過液相質譜(LC-MS),單分子實時測序(Pacbio SMRT-seq)和遺傳學方法,檢測並證實了,第二波發生在CG上的甲基化實則是4mC甲基化,是由MpDN4MT1s介導產生的,並且這種4mC甲基化覆蓋了精子基因組範圍內超過50%的CG。這是首次發現4mC存在於真核生物的強有力的證據。如下圖所示:

值得注意的是,SMRT-seq檢測到精子基因組的轉座子區有低水平的甲基化。這些訊號可能是轉座子區覆蓋的5mC 1)抑制了進一步4mC的修飾,並且本身造成了SMRT-seq的雜訊號,2)實際上被修飾成為了4,5mC,但SMRT-seq不具備檢測4,5mC的能力。透過LC-MS實驗,作者排除了第二種可能性,因為LC-MS實驗並沒有在精子中檢測到4,5mC。如下圖所示:

作者最終透過CRISPR基因敲除技術敲除了MpDN4MT1s,發現突變體精子的轉錄組有很大程度的紊亂,並且精子游動異常,表現為更強的不定向性和減慢的遊動速度。如下圖所示:

綜上所述,作者首次揭示了4mC存在於真核生物中並參與雄性生殖發育,並發現了首個真核生物的4mC DNA甲基轉移酶。這項工作開啟了表觀生物學的新篇章,引領了真核生物中4mC的研究。透過此項研究作者還揭示了地錢精子發育過程的兩波DNA甲基化重程式設計過程。這兩波DNA甲基化重程式設計最終形成了特有的全基因組(覆蓋率97%)甲基化模式,其中基因和轉座子分別由4mC和5mC標記,展示了兩種甲基化修飾的互作和對基因組分割槽的功能 (如下圖所示)。

原文連結:

https://doi.org/10.1101/2021.02.12.428880

11
  • mRNA疫苗可誘導對SARS-CoV-2及其多種擔憂的變體的持久免疫記憶
  • 為什麼要播種嫦娥五號帶回來的水稻種子,長出來的水稻能吃嗎?