首頁>科學>

今天給大家帶來的是一篇關於生信分析的文獻,該篇文獻是生信分析者學習的好範例,發表於2020年11月27日線上發表在Science Advances雜誌(IF:13.116)

Robust inference of positive selection on regulatory sequences in the human brain

人腦調控序列正選擇的強力推理

摘要

一個長期的假設是,人類和黑猩猩之間的差異可能更多地是由調節水平的適應而不是由蛋白質序列的適應所驅動的。這一點在人腦進化的調節適應中尤其突出。

該課題組掃描了29個人類和11個小鼠組織或細胞型別中CTCF結合位點的陽性選擇訊號,發現人腦相關細胞型別的陽性選擇比例最高。這一結果與基因調控的適應性進化在人腦進化中起著重要作用的觀點是一致的。

背景介紹

方法

1、正選擇突變:gkmsvm訓練

2、生成deltaSVM的經驗零分佈

3、小鼠驗證分析:晶片序列資料

4、人體驗證分析:晶片序列資料

5、果蠅驗證分析:晶片序列資料

6、人體CTCF分析:晶片序列資料

流程圖

結果

1、推斷正選擇過程的說明

gkm向量機(SVM)分類器→計算所有可能的10個多聚體的SVM權重→預測對轉錄因子結合親和力的貢獻→計算deltaSVM→預測置換的結合親和力影響→將每一個經驗的TFBS與一個姊妹物種和一個外群的祖先序列相比較。

TFBSs的自適應進化期望將它們從次優推向最優結合強度,或從舊的最優推向新的最優結合強度→預計將累積不斷改變表型的替代物,使其結合更強或更弱,而在純化選擇下進化的TFB預計將累積以近似相等的方式增加或減少結合的替代物,在恆定的最佳值附近。

這個推理遵循表型的符號測試原則→自適應選擇下deltaSVM的絕對值較大→推斷自然選擇的作用,將TFBS推到比其祖先狀態更高(正deltaSVM)或更低(負deltaSVM)結合親和力的新適應度峰值。

2、小鼠肝臟TFBSs陽性選擇的檢測

在從CAST/EiJ分化後,在導致C57BL/6J的譜系上的正選擇(圖2A)。gkmsvm非常精確地分離CEBPA結合位點和隨機序列(圖2B)。

基於三個物種的實驗晶片序列峰,以SPRET/EiJ為外群,該課題組確定了三類CEBPA結合位點:在所有三個物種中保守(“保守”,24280個位點),C57BL/6J中的譜系特異性增益(“增益”,6304個位點),以及C57BL/6J中的譜系特異性丟失(“丟失”,6692個位點)。deltaSVMs的分佈對於守恆是對稱的,對於增益是向正deltaSVMs傾斜的,對於損失是向負deltaSVMs傾斜的。這些結果證實了基於gkmsvm的方法能夠準確地預測取代對轉錄因子結合親和力變化的影響幾乎20%的增益在正選擇下進化(圖2D)。在焦點物種C57BL/6J中,陽性結合位點(PBSs)比非陽性選擇結合位點(非pbs)具有更高的結合親和力(圖2,E和F)。使用CAST/EiJ作為祖先結合親和力的近似值,發現祖先具有更強親和力(圖2G)。

3、用人肝TFBSs驗證正選擇推理

在與黑猩猩分化後,以大猩猩為外群的人類譜系中,CEBPA結合位點的選擇是陽性的(圖3A)。在小鼠中,從15806個人類CEBPA結合位點訓練的gkmsvm可以非常精確地分離TFBSs和隨機序列(圖3B)。

deltaSVMs的分佈稍不對稱,正值的比例較高(圖3C)。陽性結合位點(PBSs)在人類和黑猩猩之間的固定核苷酸變化與人類多型性位點的比率顯著高於非PBSs(圖3D)。PBS靶基因在人群中的表達方差顯著低於非PBS靶基因(圖3E)。

這些結果有力地說明該課題組的方法是檢測真實的自適應進化訊號。

4、人組織CTCF結合位點的適應性進化

與其他細胞型別相比,與大腦相關的細胞型別具有更高的陽性選擇比例(圖4A)。沒有一種組織型別具有特別高的適應性進化,與大腦相關的組織是最低的(圖4B)。

該課題組的方法不需要定義先驗中性位點,而是考慮變異對活動的影響。此外,在負選擇背景下的正選擇可能不會使進化速度高於中性預期,但結合親和力的一致變化仍然可以檢測到。

最重要的驗證是獨立於群體資料的預測驗證了更高的替代與多型性比率的期望(圖3D)。這和相鄰基因的較低表達差異(圖3E)與正選擇將增加分化但消除多型性以及選擇的表型將受到更強的純化選擇的預測一致。此外,結合親和力的變化發生在該課題組模型預測的方向上(圖2,E到G),並且可以驗證多效性限制適應的預測。

該課題組的結果支援長期以來提出的適應性調節變化在人腦進化中的重要性。並且檢測到高比例的正選擇的腦相關細胞型別在功能上與認知能力有關。

在腦細胞型別之外,該課題組發現男性生殖系統(前列腺和包皮)比女性生殖系統(卵巢、子宮和陰道)具有更高的適應性調節進化。

侷限性:

1、在序列進化的零模型中,該課題組假設每個鹼基對(bp)位點都有獨立的突變模式,並且所有位點的突變率都是一致的。然而,突變率和突變模式都取決於相鄰的核苷酸。

2、雖然該課題組沒有透過對老鼠進行同樣的分析來發現類似的模式,但還不可能得出人類或靈長類動物特有的模式。

3
最新評論
  • mRNA疫苗可誘導對SARS-CoV-2及其多種擔憂的變體的持久免疫記憶
  • 趙文銀:人類的第一個知識是如何創建出來的