2021年01月24日 新浪科技綜合
科學家將“Hello World”翻譯成鹼基語言,儲存到大腸桿菌的DNA中。|改編自ChemistryWorld
大資料時代,我們在網路上每一個動作,比如網上衝浪、觀看影片,甚至跑步、走路等日常行為,每分每秒都在產生大量資料。它們如一條條河流,匯聚成資料的汪洋大海。
如此大量的資訊如何儲存?珍貴的數字記憶要如何長久可靠地儲存?科學家們想到了一種方法,將資料寫入活細菌的DNA中!
最近,美國哥倫比亞大學的研究人員透過改變環境電壓,引導“基因魔剪” CRISPR-Cas系統,將“hello world”翻譯成鹼基語言,錄入大腸桿菌的DNA中。在繁衍80代以後,這些大腸桿菌體內儲存的資料仍然基本完好無損。
相關研究發表在1月11日的《自然·化學生物學》雜誌。
資料時代,儲存的革新
在地球生命系統中,DNA 可謂無處不在。自然將生命的遺傳資訊儲存在 DNA 中,人類也可以將資料資訊儲存其中。
計算機的二進位制語言只需要0和1兩個符號,即可編碼所有資訊。生命的本質也是一種語言,那就是由 A、T、C、G 四種鹼基串聯而成的 DNA ,四種鹼基的順序蘊藏著生命的資訊。
早在上世紀80年代末,就有人提出,或許可以將計算機的二進位制數字語言轉換成DNA的四種鹼基語言,從而將資料資訊儲存在DNA上。讀取時只要反向進行DNA測序即可。
相比於人類津津樂道的矽,DNA 簡直是資料儲存的理想載體。首先,DNA 的儲存密度非常大。如果我們能夠像大腸桿菌那樣包裝DNA,那麼全世界的資料資訊都可以儲存在1公斤重、只佔粉筆盒大小空間的一堆 DNA 中。
其次,一般物理儲存裝置使用壽命往往不到10年,DNA 則可將遺傳資訊完整儲存100年以上;如果是在零下18℃以下的低溫環境中,甚至可儲存上萬年、數十萬年。
第三,DNA 儲存過程耗能極少。要儲存同樣大小的資訊,DNA 的耗能量只相當於閃盤的億分之一。
人工合成 DNA 帶來希望
在實際操作中,二進位制數字語言要如何轉換成DNA的四種鹼基語言呢?2012年,哈佛大學遺傳學家喬治·丘奇團隊確立的規則是,用鹼基A、C編碼二進位制的0,G、T編碼二進位制的1。
經過簡單翻譯,一本包含大約5.34萬個單詞的書籍、11張JPG圖片、一段簡短的計算機程式,全部被編碼進不到億萬分之一克的DNA微晶片中。這些檔案大小相當於659千位元組。之後,研究人員利用 DNA 測序技術成功閱讀了這本書,雖然略有瑕疵地發現了22個錯誤。
幾個月後,歐洲生物資訊研究所採用另一種策略,同樣將大小為739千位元組的檔案寫入人工合成DNA中,讀取正確率接近100%。
這兩項研究讓人們看到了DNA儲存技術的希望,也開啟了研發熱潮。之後,儲存資料的大小不斷突破上限,從22兆位元組,到200兆位元組,再到維基百科所有16GB 的資料。
DNA資料儲存裝置。|Takahashi et al, 2019
不過,人工合成DNA資料儲存技術要實現商業化應用,還有一些重大問題要解決。
一是成本過高,目前人工合成儲存1兆位元組資料的DNA,需要3500美元,解碼過程還需要額外的1000美元。二是無論儲存還是讀取過程都需要專業裝置,個人使用極不方便。三是DNA儲存需要低溫環境,否則長時間容易發生 DNA 降解,導致資料失真或丟失。
活細菌蘊藏著新可能
既然人工合成 DNA 有缺陷,那能不能借用活細菌的 DNA 呢?比如大腸桿菌,在實驗室只需要少量的營養物質就能茁壯成長,成本應該也會低很多。
事實上,早在2017年,丘奇團隊就開創性地利用“基因魔剪” CRISPR–Cas 技術,將編碼資訊的DNA片段送入細菌體內。CRISPR–Cas 系統可以對任何DNA序列進行精準修改,如將鹼基A替換成鹼基G,或者刪除、插入、替換一段特異的DNA序列,就像我們使用 Word 軟體編輯文字一樣。
實驗中,丘奇團隊將一些黑白影象和一張飛馳駿馬動圖編碼為DNA序列,插入大腸桿菌的基因組中。在大腸桿菌經過多代繁殖後,研究人員仍然能夠還原動圖資訊,正確率達90%以上。
左邊是飛馳駿馬動圖的原圖, 右邊是將該動圖儲存在活細菌中,並經過多代繁殖後恢復的動圖。 |SETH SHIPMAN
這一次,哥倫比亞大學的研究人員則進一步發展了該方法。他們用電化學方法調控 CRISPR 系統看是否行使功能。需要儲存的二進位制資訊先被轉換為DNA序列,並插入環狀質粒(一種穩定的DNA環),然後隨質粒轉入大腸桿菌體內。
透過改變化學試劑的濃度,就可以改變細菌周圍的電壓,這時一些特定的環狀質粒複製數會顯著增加。CRISPR 系統感知到這種變化,並將質粒中的插入片段(目標DNA序列)寫入細菌基因組,在生物體內實現資料資訊的自動儲存——這就像為儲存動作設定了一個開關。
透過感受周圍電壓變化,大腸桿菌將質粒中的目標片段自動寫入基因組。|Sproetniek/iStock
為了研究該方法的可行性,研究人員將“hello world”錄入大腸桿菌的DNA中,並測試它們繁衍80代後,所攜帶的資訊是否仍然穩定,結果發現正確率達90%以上。他們還將大腸桿菌混入土壤微生物中,對混合物進行測序,仍然可以恢復儲存的資訊。
資訊編碼為DNA序列,之後或者直接匯入大腸桿菌中,或者先插入環狀質粒,再轉入大腸桿菌。|MDPI
當然,對活細菌儲存數字資訊的研究目前才剛剛開始,還有很多技術難題需要攻克。不過,隨著眾多科學家和大型企業的加入,這些技術難題將被一一解決。相信在不遠的將來,DNA資料儲存裝置將隨處可見。
那時,我們或許可以透過解碼存放在小試管裡或活細菌中的一段DNA,來閱讀一本科幻小說,聽一段搖滾樂,觀看一部大製作電影。甚至如今儲存在電子裝置中的任何檔案,將來都能在DNA資料儲存裝置中找到。