首次闡明瞭“芋螺毒素基因→毒素轉錄本→毒素蛋白→翻譯後修飾毒素肽”的最重要、最基本的生物學規律,在探索芋螺毒素的本質及普遍規律方面起到了巨大的作用,奠定了芋螺毒素研究的理論基石,是芋螺及芋螺毒素研究領域的重要突破性進展,相關成果發表於Nature子刊Cell Discovery(圖1)。
芋螺是一大類能產生和分泌劇毒毒素的掠食性海洋腹足綱軟體動物,全球約有700種[2]。
儘管芋螺毒素的應用前景已得到諸多驗證,甚至已有少數相當成熟的醫藥產品上市。但芋螺基因組的解讀工作卻因提取和組裝困難而遲遲未有突破。
在本成果發表之前,僅有一些轉錄組和蛋白組資料發表,尚無任何一種芋螺的全基因組被成功組裝和破譯。
本研究以中國南海常見種桶形芋螺(圖2a)為代表,對首個芋螺基因組進行了高深度測序,併成功構建了桶形芋螺的基因組圖譜。
桶形芋螺基因組預估3.98 Gb(圖2b),最終組裝為3.43 Gb,scaffold N50和contig N50值分別為232.61 kb和171.48 kb,基因組GC含量佔比43.8%,轉座因子佔比38.56%,共編碼22,698個基因。
該成果首次在基因組水平鑑定到133個芋螺毒素基因,分屬於21個已知的超家族、1個富半胱氨酸家族、1個無半胱氨酸家族和4個新的超家族(圖2e)。
這些毒素基因通常由1至4個長度較短的外顯子組成(圖2c,2d),每個外顯子長度從14 bp到345 bp不等,平均外顯子長度為87 bp(圖2f)。
圖2. 桶形芋螺基因組及133個芋螺毒素基因的特點總結
透過整合基因組、轉錄組和多肽組等多組學資料,研究團隊首次揭示了適用於芋螺毒素的主要中心法則,即總基因:轉錄本:蛋白質:翻譯後修飾毒素肽的序列條數比值約為1:1:1:10s。
以芋螺毒素基因conot103為例,在基因組層面,該基因由3個長度分別為76、82、37 bp的外顯子組成。
在轉錄組中,找到對應的轉錄本mRNA全長195 bp,編碼總長為64 aa的毒素前體肽(Bt176)。
在多肽組中,找到了46條對應的多肽序列,並檢測到第58和61位脯氨酸(P)的翻譯後修飾(圖3)。
圖3. 芋螺毒素表達的中心法則(以毒素基因conot103為例)
研究發現,芋螺透過多種蛋白質水平加工過程(如不同的切割位點、翻譯後修飾和N-/C-末端截斷)產生了大量多樣性的芋螺毒素肽,進而解釋了為什麼單個桶形芋螺中僅133個基因和大約123個轉錄本,卻可以產生數千條芋螺毒素肽。
透過功能預測發現,本研究中許多芋螺毒素與已知的鎮痛藥ω-MVIIA、抗成癮藥AuIB和殺蟲劑ImI具有高度相似的空間結構(圖4),從而表明桶形芋螺基因組資料是可用於高通量預測和開發潛在創新藥物的寶貴遺傳資源。
圖4. 芋螺毒素肽的三維立體結構預測
核心成果
參考文獻
[1]Peng C., et al. Cell Discovery, 2021, 7(1): 11.
[2]石瓊、高炳淼、彭超主編,海洋芋螺資源圖鑑。中山大學出版社,2018年。
[3]Gao B., et al. Toxins, 2017, 9(12):397.
[4]Peng C., et al. GigaScience, 2016, 5:17.
[5]Huang Y., et al. Marine Drugs, 2017, 15(7):228.
[6]Yao G., et al. Marine Drugs, 2019, 17(3):193.
[7]Gao B., et al. Toxins, 2017, 9(7):214.
[8]Gao B., et al. International Journal of Molecular Sciences, 2018,19(12):3901.
[9]Gao B., et al. Plos One, 2018, 13(7):e0193053.
[10]已獲得11個國際PCT專利授權,包括5項美國專利(US15539709、US15539720、US15539729、US15539752、US15515696)和6項歐洲專利(EP14908844.5、EP14908845.2、EP14903282.3、EP14903133.8、EP14903256.7、EP14903491.0)。