首頁>健康>

真核生物的染色質具有複雜的高階結構,由DNA一圈一圈纏繞在組蛋白上形成串珠式模型並進一步摺疊聚集而成。

基因的轉錄必須要將相應的染色質開啟形成開放區域才能結合其他的轉錄調控因子。因此可以說染色質開發區域是基因組編碼生命的視窗。單細胞ATAC-seq(Assay for Transposase-Accessible Chromatin using sequencing)技術在單細胞層次上通過Tn5 DNA轉座酶在開放染色質插入測序接頭進行標記並測序,從而獲取“高分辨“的單細胞精度的染色質開放圖譜,並依此揭示細胞異質性的調控機制。

越來越多的研究者們應用單細胞ATAC-seq技術,在腫瘤、免疫、發育領域獲取大量的測序資料。然而,目前沒有一個有效的方法可以很好的分析挖掘海量的單細胞ATAC-seq資料中寶貴的生物資訊。

單細胞ATAC-seq資料分析的難點在於資料本身。第一,細胞整體的染色質開放位點數有幾十萬之多,造成所謂的“維度災難”。另外,由於生物的原因許多潛在的開放沒有訊號,資料異常稀疏,技術限制帶來的資料丟失極大程度上加劇了這種現象。特別的,在二倍體基因組上一個開放區域一般至多隻有兩個拷貝,使得資料近乎二值化。這些問題都給單細胞ATAC-seq資料的分析帶來了巨大挑戰。

2019年10月8日,清華大學生命學院張強鋒課題組在 Nature 子刊 Nature Communications 雜誌發表題為:SCALE method for single-cell ATAC-seq analysis via latent feature extraction 的研究論文。

在該論文中,張強鋒課題組提出了SCALE,利用人工智慧深度學習的方法,結合變分自編碼器和高斯混合模型,提取單細胞ATAC-seq資料的隱層特徵,將問題從複雜稀疏的高維度的染色質開放圖譜空間投射到了簡單抽象的低緯度特徵空間。

這種處理不但可以發現和解析細胞特異性的染色質圖譜模式,還通過相似細胞資訊共享,填補了技術限制導致的缺失值,從而巧妙地解決了單細胞ATAC-seq資料中高維度、稀疏性、二值化等問題。

SCALE提供了完整的視覺化、聚類、資料增強、幫助下游生物資訊的挖掘,為研究者們解碼單細胞表觀遺傳學提供了有力的工具。

參考內容:

https://www.nature.com/articles/s41467-019-12630-7

  • 孕期如何控制饑餓感
  • 孩子睡前喝牛奶,喜歡吃肉,這是導致積食咳嗽主要原因