首頁>科學>

COVID-19

本文根據發表於《國際抗菌劑雜誌》https://doi.org/10.1016/j.ijantimicag.2020.106272文章內容所撰寫。該文章是由匈牙利布達佩斯塞梅爾韋斯大學生物資訊學系,匈牙利 TTK癌症動量生物標誌物研究小組,匈牙利布達佩斯佩茲梅尼·佩特天主教大學資訊科技和仿生學院 合作發表。

https://doi.org/10.1016/j.ijantimicag.2020.106272

一些研究估計,病毒在總人口中的死亡率較低,而其他研究人員報告,當病毒擊中危重病人時,死亡率高達26%。 總體而言,根據世衛組織(2020年10月)的當前資料,死亡率約為2.7%。

病毒的線性基因組有29,903個鹼基,含有25個基因[5],參考序列可利用加入編號MN908947在基因庫中獲取。對病毒基因組的植物遺傳學分析表明,三種變異為A、B和C,在比較來自亞洲、歐洲或美國人的序列時分佈不同[6]。病毒基因除其他外編碼一個包絡蛋白,一個RNA依賴RNA聚合酶,表面糖蛋白,外核素酶,甲基轉移酶,和11個非結構蛋白。其中一些在病毒內,但其他,包括尖峰糖蛋白,膜糖蛋白,和包絡蛋白在病毒表面。

病毒基因組的基因組改變可以導致更好或更壞的結果,識別這些突變是至關重要的。在這裡,將病毒的蛋白質水平突變與臨床結果相關聯。

從理論上講,任何功能或結構病毒基因都可以對病毒的效率產生影響,並且兩種突變或表達的改變都會增加致病性。重要的是要強調,即使是冠狀病毒的未翻譯區域也可以在病毒複製中發揮重要作用,正如先前文章中所證明的。與其他病毒相比沒有什麼不同,新的突變隨著其傳播而不斷出現。病毒中發現的一些突變導致一種新的RNA依賴性RNA聚合酶變異,而其他基因組變化則透過導致病毒的更易傳播形式來驅動病毒的進化和傳播。有可能使病毒更容易傳播的突變具有顯著的進化優勢,正如變種與尖峰G614的證明,主要在2020年2月至7月之間取代D614突變。

在這種情況下,最重要的問題是識別病毒突變導致不同的患者結果。導致輕度疾病的突變可促進病毒的傳播,從而維持疫情。導致更嚴重疾病的其他突變需要立即關注,以防止有害的結果。在這裡,我們的目標是透過同時將結果與大量患者的所有突變關聯,來識別和排名與改變患者結果相關的突變。

方法,利用"hCoV-19/武漢/WIV04/2019"作為參考,對地理資訊系統病毒庫病毒序列中的突變進行了評估。患者結果分為輕度疾病、住院和嚴重疾病(死亡或在重症監護室有檔案記錄的治療)。應用奇方測試來檢查每個突變與患者結果之間的關聯。錯誤發現率被計算為糾正多個假設檢驗,透過 FDR 截止 5% 的結果被接受為顯著。

由於患者樣本與超過六十種不同的結果分類一起註釋,我們不得不強制這些分類分為三大類。患者"無症狀","不住院",有"輕度"疾病,在"家"都分配有"輕度"疾病。此外,在門診部接受治療、隔離或由醫生網路治療的患者被歸類為"輕度"患者。絕對需要醫療護理的患者被分配到"住院"小組。其中包括"住院"、"住院"、"出院"和"康復"。此外,包括其中任何一個的註釋組合也分配給這一組(例如"最初住院"或"住院")。

最後,有有害結果的患者被分配到"嚴重"群體。其中包括那些"死亡"者、患有"嚴重"疾病的人、進入"重症監護室"的人。此外,這些與其他註釋(如"住院/ICU")的任何組合也新增到此類別中。

所有資料處理和統計分析步驟都在 R 統計環境 v 3.6.3 中執行。資料處理於18th2020 年 10 月。應用奇方測試來檢查每個突變與患者狀態資料之間的關聯。使用Benbeni-Hochberg方法計算的誤發現率可糾正多個假設檢驗結果,只有透過5%的FDR截止結果才被承認為顯著。

一起有149,061個病毒核酸序列可用,其中147,960個序列包括整個病毒核酸序列。有7 702名患者獲得臨床資料,其中4 566名患者也有隨和資料。這隻佔總資料的一小部分,這意味著我們的發現可能包含抽樣偏差。

在檢視這些患者的臨床引數時,58.6%為男性,36.5%為女性(其餘樣本沒有此資訊)。樣本的地理來源覆蓋全球:4.2%來自非洲,46%來自亞洲,26.8%來自歐洲,12.4%來自北美,10.2%來自南美洲。樣本收集發生在 2019 年 2019 年 12 月 30 日至 14.9.2020 之間。在所有隨發病人中,有708人患有輕度疾病,3,306人必須住院治療,552名患者患有嚴重疾病。

一起確定了3,733個不同突變,影響蛋白質氨基酸序列,其中937個突變不存在在臨床隨發的樣本中。在檢視所有突變時,我們在每個樣本中平均識別了 4.7 個突變。

作為內部控制,以驗證與患者比例相關的突變流行率的任何潛在偏差,我們計算了每個臨床結果組的平均突變數,並發現了類似的值(在輕度、住院和嚴重結果的患者中,平均值分別是4.8、4.6和5.1)。

在分析所有突變與臨床結果的相關性時,79個突變在FDR<5%達到統計顯著性。補充表 1 中顯示了每個佇列中樣本編號的這些突變的完整列表,補充表 2中提供了每個被調查患者的突變資料。

COVID-19突變與4,566例有基因組和隨從資訊的患者的溫和結果相關,在5個不同的基因中被發現。

結果,突變對映到3733個非沉默突變的氨基酸變化。與輕度結果相關的突變位於 ORF8 中, NSP6、ORF3a、NSP4和核核膠囊磷蛋白N.與劣質結果相關的突變位於表面(S)糖蛋白中,在RNA依賴RNA聚合酶中,在 ORF3a、NSP3、ORF6 和 N. ORF6 和 N. ORF3.在22個最重要的突變中,有4個對映到10個氨基酸長磷酸化的N段上,這表明儘管有明顯的取樣限制,這種方法可以在病毒基因組中找到功能相關的位點。

當搜尋與住院或嚴重結果相關的突變時,我們使用上述過濾器,包括至少 2% 樣本中存在的突變。一起15個突變通過了這些標準。它們起源於7個基因:L54F、D614G和V1176F在表面(S)糖蛋白,A97V和P323L在RNA依賴RNA聚合酶, ORF3a蛋白中的Q57H和G251V,P13L,S194L,R203K,G204R和G292T中的核膠囊磷蛋白,ORF6蛋白中的G33T,NSP3蛋白中的S1197R和T1198K突變。

為了不錯過導致致命結果的突變,我們還包括了至少10例嚴重結果患者存在的所有突變。這一附加分析還帶來了兩個突變,NSP7蛋白中的L71F和 ORF3A基因中的S253P突變。分別在60(L71F)和11例(NSP7)患者中發現後,這些結果與53例和11例嚴重結果有關。

有趣的是,導致輕度結果的突變的總體流行率(n=1,851)小於導致更壞結果(n=11,725)的突變患病率,但與此同時,在整個群體中,輕度結果的患者比例也較小(18.3%)。然而,很大一部分突變(n=7,875)與任何臨床結果沒有顯著關聯。

核資本磷蛋白是與輕度和重度患者結果相關的最顯著突變的蛋白質。所有這些變化都處於接近基因組位置,G196V和S197L導致溫和的結果和R203K,G204R和S194L導致低劣的結果。有趣的是,當比較S197L(71%的溫和結果)和S194L(1%的溫和結果的機會)變種時,相對風險極高。有趣的是,大多數核帽磷蛋白突變被對映到從位置194到204的一小段氨基酸。該區域與磷酸化"RS-motif"[14]相吻合,該"RS-motif"對映到蛋白質(15])的固外非結構化素富區域181-213。已知此站點的磷酸化具有重要作用,例如宿主RNA直升機體DDX1的招募,這有利於模板的讀取,並可實現更長的亞基因組mRNA合成(https://www.uniprot.org/uniprot/P59595)。這一觀察需要進一步的跟進——特別是因為核核膠囊磷蛋白是對抗病毒的潛在藥物靶點之一。

結論,實驗研究證明,病毒基因的突變可能與臨床結果有直接關係。實驗的結果有助於快速識別病毒感染,這些感染含有與嚴重結果相關的突變。

引用:

1.https://doi.org/10.1016/j.ijantimicag.2020.106272

https://doi.org/10.1038/s41591-020-0820-9 K.G. Andersen, A. Rambaut, W.I. Lipkin, E.C. Holmes, R.F. GarryThe proximal origin of SARS-CoV-2 Nat Med, 26 (2020)

10
  • mRNA疫苗可誘導對SARS-CoV-2及其多種擔憂的變體的持久免疫記憶
  • 見過木土相合,為什麼從沒見過行星凌行星?