撰文 | Qi
自閉症譜系障礙(Autism spectrum disorder, ASD) 是一種早發性發育障礙,其特徵是社交缺陷以及限制性或重複性行為。家族研究表明ASD具有豐富的遺傳基礎,既包含遺傳變異也同時包含從頭變異。據估計,在家庭中僅有一名兒童患ASD的所有病例中,從頭突變(de novo mutations)約佔30%比例。作為人類從頭突變的主要來源之一,串聯重複序列(Tandem repeats, TRs)被定義為1到20個鹼基對連續重複的序列,已證實其序列擴張與數十種神經和精神疾病有關【1-4】。然而,從頭串聯重複序列突變尚未在全基因組範圍內表徵,且它們對ASD的貢獻仍未被探知。
近日,來自美國加州大學聖地亞哥分校的Melissa Gymrek課題組和加州大學洛杉磯分校的Kirk E. Lohmueller課題組在Nature雜誌上合作發表了一篇題為Patterns of de novo tandem repeat mutations and their role in autism 的文章,在這項研究中,作者開發了一種新的生物資訊學方法,用於從測序資料中識別和確定從頭串聯重複序列突變(後文簡稱為新生TR突變),並對患有ASD的先證者和未患病手足中的新生TR突變進行全基因組特徵分析。作者發現,在ASD先證者中全基因組範圍內都存在大量TR突變,在胎兒大腦調節區域更為富集,且預計在進化上更具危害性。總之,這項工作強調了在未來新生突變研究中考慮重複變異的重要性。
作者開發了一種從全基因組測序資料庫中識別親代-子代中新生TR突變的方法,命名為“MonSTR”(見圖1)。首先,使用來自目前最大的自閉症資料庫“Simons Simplex Collection(SSC)”的資料對新生TR突變進行全基因組分析,且已確定該庫富集可能攜帶先前未鑑定的致病性從頭突變的先證者【5】。隨後使用GangSTR演算法對串聯重複序列進行基因組分型,接著透過篩選,作者在在1593個家庭的94616個不同位點共鑑定出175291個高度可信的TR突變。同時,作者也在模擬WGS資料集上對此方法進行測試,與傳統方法相比,MonSTR在檢測新生TR突變方面具有更高的靈敏度,且假陽性率較低。
圖1. 研究設計模式圖(BAM, binary sequence alignment/map format.VCF, variant call format)
接下來,作者對TR突變的全基因組模式進行分析。作者先將分析結果與已知的TR突變趨勢進行比較,與之前的研究類似,重複單元較短的TRs估計突變率最高,並與參考TR的總長度呈正相關。此外,作者觀察到大多數突變是由單個重複單元的擴充套件或收縮引起的,較大突變的比例較小,這一趨勢因重複單元長度而變化,但總的來說,突變傾向於擴張(71%)而不是收縮(29%)。作者進一步檢查了母系或父系突變亞群的突變大小,結果顯示上述觀察到的總體擴張偏好主要是由母系衍生的突變驅動的。此外,母體突變導致重複單位複製數顯著增大,且這一趨勢在所有重複單元長度上均能再現,其中在二核苷酸TRs上效果最強(見圖2)。
隨後,作者對ASD中TR突變負荷進行分析。全基因組中新觀察到的常染色體TR突變總數在先證者中(平均54.65個突變)顯著高於非ASD手足(平均53.05個突變)。然而,這一研究在檢測先證者及其手足突變富集的特定TR基因座方面的能力有所欠缺。作為替代,作者評估了特定基因組註釋中的TRs在先證者中是否顯示相較於非ASD手足而言過多的突變,並發現僅在ASD先證者中觀察到的具有編碼或啟動子突變的基因,與在非ASD手足中發現的具有突變的基因相比,顯示出明顯更高的胎兒期大腦表達。此外,先證者突變預計會更顯著地改變大腦中鄰近基因的表達。值得注意的是,大多數(84%)TR突變是早已存在於未患病親本當中,提示只有一小部分突變具備致病性。
最後,作者試圖根據預測的致病作用進一步確定TR突變的優先順序。由於TRs往往是多等位基因導致非編碼基因突變或框內插入缺失突變,因此通常用來註釋SNV突變的指標並不適用於TRs。為了克服這一挑戰,作者開發了一種群體遺傳學構架命名為“SISTR(selection inference at short TRs)”,以衡量針對單個TR等位基因的陰性選擇。作者應用SISTR估計全基因組TRs的選擇係數,並對先證者及其未患病手足進行測試。最終共鑑定出35個突變,其中25個存在於先證者中,這一發現導致先前未觀察到的等位基因預計具有嚴重有害性。其中,多個先證者突變存在於與ASD相關點突變的基因中(例如PDCD1、KCNB1、AGO1等),而在未患病手足中僅發現兩個罕見的突變與ASD基因相關聯。以上資料表明在最強選擇下導致罕見等位基因的TR突變子集對ASD致病性風險最大。總體而言,這項研究提出了一個對從頭串聯重複序列突變進行識別和風險優先排序的新框架,這將為進一步描述TR突變及其在ASD和其他疾病中的作用提供寶貴的資源。
原文連結:
https://doi.org/10.1038/s41586-020-03078-7
製版人:十一
參考文獻
1. American Psychiatric Association. Diagnostic and Statistical Manual of Mental Disorders 5th edn (2013).
2. Gaugler, T. et al. Most genetic risk for autism resides with common variation.Nat. Genet. 46, 881–885 (2014).
3. Iossifov, I. et al. The contribution of de novo coding mutations to autism spectrum
disorder. Nature 515, 216–221 (2014).
4. Willems, T., Gymrek, M., Poznik, G. D., Tyler-Smith, C. & Erlich, Y. Population scale sequencing data enable precise estimates of Y-STR mutation rates. Am. J. Hum. Genet. 98, 919–933 (2016).
5. Fischbach, G. D. & Lord, C. The Simons Simplex Collection: a resource for identification of autism genetic risk factors. Neuron 68, 192–195 (2010).