首頁>科學>

2017年,黃岩誼課題組將通訊理論中的糾錯碼引入到測序技術中,透過三條正交的簡併序列來檢測並校正測序錯誤。這項“糾錯碼測序技術”兼具較長的讀長和極高的準確度。近日,該課題組又在《國家科學評論》(National Science Review, NSR)發表文章,透過計算機模擬構建的“虛擬測序儀”,揭示了糾錯碼測序技術中“失相”問題的模式、特徵,並在此基礎上建立了一個失相校正演算法,為更加高效、準確的測序技術提供了一種實用解決方案。

高通量測序中的“失相”問題

近二十年來,新一代高通量測序技術快速發展,極大地改變了生命科學和醫學研究,並迅速進入醫學診斷等領域,服務於健康產業。

當前主流的高通量測序技術大多采用“邊合成邊測序”的方式,且會將每一條待測DNA分子擴增成多條DNA組成的簇,從而放大可檢測訊號。理想情況下,一簇DNA中的每個分子在測序過程中都是同步的,所以週期性反應所獲得的測序訊號就直接反映出待測DNA的序列資訊。

然而,在真實的測序體系中,各個分子間從來都不是完美同步的。由於反應不完全或者反應體系中雜質引起的副反應,一簇DNA中的各個分子會逐漸失去同步性,反映到測序過程中,就會使測序訊號變得紊亂,而無法直接反映DNA的序列資訊。這一現象稱為“失相”,即分子間訊號“相位”的失諧。失相問題極大地限制了高通量測序的讀長和準確性。

每一種基於類似原理的測序方法,都存在這樣的現象。而在使用不同化學反應的不同測序方法中,失相現象的特徵也不盡相同。如要建立新的測序技術,對其失相現象的充分理解是一個必須解決的主要問題。

“糾錯碼測序”中的失相模式

為了提高測序技術的準確性,北京大學黃岩誼課題組於2017年將通訊理論中的糾錯碼引入到測序技術中,透過三條正交的簡併序列來檢測並校正測序錯誤。這一項糾錯碼測序技術兼具較長的讀長和極高準確度的潛力。

糾錯碼測序中也有失相問題。近期,黃岩誼課題組透過計算機模擬,構造了一個“虛擬測序儀”,來研究糾錯碼測序方法中失相問題的模式、規律,並探索解決方案。

研究者發現,“單鹼基滑動”是糾錯碼測序獨有的失相模式。在糾錯碼測序中,雜質引起的副反應會使DNA分子發生額外的延伸反應,稱之為初級超前反應。若初級超前反應僅延伸一個鹼基,則該DNA分子會立刻被過量的底物進一步延伸,稱之為次級超前反應;而若初級超前延伸了不止一個鹼基,則上述次級超前反應不會發生。即,次級超前反應發生的條件可以被歸納為單鹼基滑動。

利用“虛擬測序儀”,研究者探索了DNA分子在不同反應條件下的延伸規律,找到了影響單鹼基滑動的關鍵因素。依據單鹼基滑動這一失相模式,作者還建立了一個失相校正演算法,並證明該演算法可用於校正至少500輪的測序反應(對應1000 bp的測序讀長)。

最後,作者還將失相校正演算法推廣到了具有更高準確度的雙色糾錯碼測序上,並在實際測序中進行了驗證。

“單鹼基滑動”這一新型失相規律的發現和歸納,不僅僅對“糾錯碼測序方法”提供了更加深刻的理解,同時對於如何更加快速高效地實現對測序化學反應訊號的解讀和推算,提供了一個實用的解決方案。

19
最新評論
  • mRNA疫苗可誘導對SARS-CoV-2及其多種擔憂的變體的持久免疫記憶
  • NSR綜述:氮雜環磷氫化合物的負氫轉移活性及其合成應用