摘自王立銘著《上帝的手術刀——基因編輯簡史》
2012年,來自生命科學僻靜角落的純粹基礎研究,第三次徹底震撼了基因編輯領域。 而這次出頭搶了“神話”風頭的小兄弟,有個長得可以嚇跑一半讀者的學術大名,叫“成簇的規律間隔的短迴文重複序列”(clustered regularly interspaced short palindromic repeats)。不過大家先不用害怕,這麼佶屈聱牙的名字別說你們,就連科學家們也都記不住。於是大家用首字母組組合“CRISPR”來稱呼這種新技術。CRISPR的發音和英文單詞“crisper”(保鮮盒)相似,而新鮮出爐的CRISPR技術也真的像這個發音暗示的那樣,鮮活水靈,一個猛子扎到基因編輯的領地裡,成功扮演了攪局者的角色。 其實CRISPR本身是個已經有些年頭的發現。這種東西最早發現於1987年,那個時候就連鋅手指都才初露崢嶸,更別說“神話”蛋白了。
1987年,一些日本科學家在研究大腸桿菌的時候,發現它的基因組DNA上有一些看起來怪里怪氣的重複結構:有一段29鹼基的序列反覆出現了5次,兩兩之間都被32個鹼基形成的看起來雜亂無章的序列隔開了。形象地來說,就像是給你5塊一模一樣的磚頭,再發給你4根顏色不同的皮筋,然後要求你用紅皮筋把1號磚頭和2號磚頭連起來,用綠皮筋把2號和3號連起來,用黃皮筋把3號和4號連起來……這樣連起來就有點像日本科學家發現的這段DNA序列了(見圖4-6)。
對於這種奇怪序列的具體作用,大家當時完全是一頭霧水。在當時看來,DNA主要有兩種功能:一是負責編碼蛋白質的氨基酸序列,直接參與蛋白質生產(3鹼基對應1個氨基酸);二是輔助蛋白質生產(例如有些DNA序列是負責和轉錄因子結合的)。而這種串聯起來的重複結構看上去兩者都挨不上邊。當然了,這本身也談不上是什麼大問題,生物學裡奇奇怪怪的發現實在太多了。地球生命在半徑6 000多千米的地球上進化了40多億年,有著什麼樣奇怪的特徵都不足為奇。也許大腸桿菌這段DNA壓根就沒什麼用也未可知,人的腋毛和闌尾不是看起來也沒什麼用處嘛!
然而,僅僅幾年以後事情就開始發生變化了。1993年,西班牙科學家弗朗西斯科・莫西卡(Francisco Mojica,見圖4-7)在另一種細菌——地中海嗜鹽菌——裡又一次發現了這種古怪的重複序列。
這就有趣了。要知道從大腸桿菌到地中海嗜鹽菌,這兩種細菌從生活環境到進化歷史都毫無相似之處可言。如果我們在大街上看到一個壯漢提著一串用彩色皮筋綁起來的磚頭,還可以認為是這個壯漢閒得無聊或者在酒後裝瘋,但要是一天之內見到了兩個這樣的壯漢,肯定會自問一下,這串磚頭是不是當地的某種奇怪民俗啊?
好巧,莫西卡也是這麼想的。於是他繼續在各種奇奇怪怪的細菌裡尋找。到了2000年,莫西卡利用當時剛剛興起的生物資訊學技術,在海量DNA資料庫裡進行檢索,竟然在20種不同微生物中都發現了這種名為CRISPR的重複DNA結構!
這就有意思了,而且這幾乎肯定說明了CRISPR不太可能是偶然現象,也不太可能僅僅是某種奇怪而無用的民俗,它應該有著非常重要乃至性命攸關的生物功能。要知道,對於任何有機生命來說,儲存、複製和傳遞遺傳物質都是件很困難也很浪費資源的事情——大家可以回憶一下我們故事裡講到過的DNA半保留複製和DNA損傷的修復。因此,要是CRISPR沒有用處,在自然選擇的作用下,我們很難想象會有這麼多不同的物種會不約而同地同時保留了這麼一長串的廢物DNA。
於是莫西卡和他的同事決定去探索一下這種未知的功能到底是什麼。2005年,他們手裡已經掌握了來自60多種細菌的多達4500段CRISPR序列,接下來就是看看它們之間有沒有什麼共性。一經對比,自然就看到奧妙了,有88段DNA居然在不同細菌中出現了多次!這88段大多是CRISPR序列中夾在重複序列之間的片段——不是磚頭,是連線磚頭的彩色皮筋。更妙的是,這88段中還有相當部分——47個——居然還不只存存在於細菌裡面。它們居然和許多病毒的基因組序列資訊高度一致!
當然了,聽過了基因治療的故事,相信你們馬上會想到,這些DNA也許是病毒入侵細菌之後,藏身於細菌基因組裡的痕跡,就像寄居人體細胞的HIV。但這個最簡單的解釋其實是站不住腳的。莫西卡他們發現的並不是完整的病毒DNA,而僅僅是病毒DNA的一小段,只有這一小段是沒法制造出病毒來的。更重要的是,看起來對於這些病毒DNA片段,細菌是經過了小心處理的,因為它們總是被夾在一段段精心設計的重複序列裡。
所以簡單來說,這些CRISPR應該不是病毒藏身於細菌基因組的痕跡,反而像是細菌在基因組裡收藏了某些病毒不同角度的快照。
這當然不是細菌暗戀病毒的證明——生物學家們沒那麼浪漫,而且,細菌大概也不會那麼熱愛這些病毒。因為這些被CRISPR序列記錄下來的病毒並不普通。與入侵人體細胞的HIV和入侵植物細胞的菸草花葉病毒類似,CRISPR記錄下的病毒,恰好是專門入侵細菌的病毒。它們依靠細菌維持自身的生存繁衍,也因此會對細菌造成致命傷害,所以它們被恰如其分地命名為“噬菌體”。
我們已經說過,宿主和病毒在億萬年的光陰裡一直在玩貓捉老鼠的遊戲。以人體為例,人體進化出了多種多樣的機制來清除入侵身體的病毒顆粒,比如免疫系統。我們身體裡有一類具備特殊功能的細胞,能夠有效識別和殺滅身體裡的病毒,保護身體的其他組織和細胞。
細菌作為一種單細胞生物,顯然不可能期待來自其他細胞的幫助。因此,如果細菌也希望抵禦病毒的入侵,必須依靠自身細胞內的資源和手段。會不會就是CRISPR?
這個想法初看起來很瘋狂:誰能相信一段DNA就能實現一整套免疫系統的功能?但是仔細想想卻很耐人尋味。CRISPR肯定有著重要的功能,同時又攜帶著許多病毒的資訊;這些病毒恰恰又是對細菌威脅最大的噬菌體。這三條放在一起的話,一個自然的猜測不就是CRISPR能幫助細菌抵抗噬菌體嗎?
這個想法驗證起來也不難。我們大家也能設計出這樣的實驗來:如果一切正如我們的猜測,那攜帶著某種病毒資訊的CRISPR序列應該就具有病毒疫苗的功能。擁有這段CRISPR序列的細菌應該不容易被這種病毒入侵,而如果把這種CRISPR轉移到另一種細菌中,也能讓這種新的細菌具有免疫力。
很快,就在2007年,這個想法得到了完美證明。一群在丹尼斯克食品配料公司工作的科學家證明,在嗜熱鏈球菌中人工新增一段CRISPR序列,可以幫助細菌抵擋某種對應病毒的入侵。這群科學家甚至還證明,細菌的免疫系統和人體一樣,居然還有自我進化的高階功能!每當有新的噬菌體病毒入侵,僥倖存活下來的細菌就會把它的基因組序列整合到自己的CRISPR序列中。下次有同樣的病毒入侵時,細菌就可以正確識別和對抗它們了。順便提一句,這幫科學家的研究物件——嗜熱鏈球菌,乃是現代酸奶工業的基石。因此,他們開展研究的出發點,也許僅僅是為了解決酸奶生產中經常出現的噬菌體感染問題!
好了,截至目前,CRISPR的生物學價值應該足夠驚世駭俗了。原來以為只有人類這樣的高等生物才擁有複雜的免疫系統,誰能想到只有一個細胞、幾微米大小的細菌居然也有。而且和人體免疫系統一樣,細菌的免疫系統居然也具備自我進化、迅速適應和對抗新病毒入侵的能力。從任何角度出發,這都是項足以載入史冊的重大發現。這個發現無比優雅和簡練地說明了有機生命的偉大生命力。一個小小的細菌,沒有多餘的空間和資源來創造複雜的免疫系統,僅僅用自身基因組序列上的一小段重複DNA片段,就能夠抵擋病毒的侵襲。
講到這裡,你可能會問,CRISPR的故事再精彩,和基因編輯、基因治療又有什麼關係呢?其實真相併不復雜。如果合上書本,把前因後果想想上幾分鐘,也許你就會明白其中的奧妙。CRISPR裡面含有病毒的部分DNA序列與CRISPR能夠抵禦病毒的入侵,這兩點之間有什麼關係嗎?憑什麼僅靠記錄一張病毒的快照,細菌就能夠殺死入侵的病毒呢?
想清楚這一點,全新的基因編輯技術就呼之欲出了。
超輕量級選手
繼續我們的問題:靠記錄下病毒的遺傳資訊,細菌為什麼就能抵禦病毒入侵呢?
為了說清楚這個問題,我們再來回想一下病毒的生命史。我們已經知道,病毒本身並不具備獨立生存繁衍的能力。病毒的“生命力”依賴於病毒顆粒能夠進入宿主細胞,釋放出自身的遺傳物質,並且利用宿主細胞的資源幫助其複製繁衍。那麼可以想象,對於病毒而言,它們進入宿主細胞後的第一件事就是迫不及待地把自己的遺傳物質給釋放出來——或者說暴露出來。反過來,對於飽受噬菌體之苦的細菌而言,病毒入侵的第一個標誌是不是就是病毒遺傳物質在細胞內的出現?既然如此,細菌是不是也可以利用這一點來實現對病毒的精確打擊:一旦在細胞內監測到病毒遺傳物質的出現,就第一時間啟動防禦機制?
如果真是這樣的話,CRISPR序列的功能也許就可以理解了。既然CRISPR序列中有一部分和病毒遺傳物質完全一樣,那麼是不是可以想象這樣一個過程:細菌會把細胞記憶體在的所有DNA都一一抓來和CRISPR序列仔細比對,一旦發現兩者完全一致,就意味著病毒在細胞內出現了,就必須馬上啟動防禦機制?
這種做法聽上去很合理。不過,合理的可能性和真實的生物學之間,還間隔著漫長的探索過程。在做酸奶的法國科學家揭示了細菌的免疫功能後,許多實驗室立刻開始著手嘗試解釋CRISPR序列的工作機理(見圖4-8)。
科學家發現,和細菌體內正常編碼蛋白質的基因一樣,CRISPR序列也能被轉錄成RNA分子。這些短短的RNA分子會和細胞內的某種蛋白質結合(這類蛋白也因此被稱為cas蛋白,也就是CRISPR結合蛋白的意思),像哨兵一樣在細胞裡終日巡邏。這位哨兵尋找的物件,是任何一段能夠和CRISPR RNA完美配對的DNA分子。一旦兩者相遇並結合,哨兵就會啟動cas9蛋白的切割功能,將這段DNA切成一個個小的片段。也就是說,細菌的全套免疫系統,僅僅就是一個自帶切割功能的蛋白質,一段自帶識別功能的RNA。
如果此時我們再度回想鋅手指和“神話”蛋白就會發現,與細菌相比,複雜生物的DNA識別機制竟然是如此低效。我們說過,鋅手指識別DNA的效率是1:30,而“神話”蛋白更是低至1:102。而細菌的CRISPR識別DNA的效率是1:1,這是在理論上就無法逾越的識別效率!如此驚人的識別效率,是因為CRISPR完全避免了DNA和氨基酸之間的轉換,完全依賴RNA而不是氨基酸序列實現對DNA的識別。由於DNA的每個鹼基恰好對應RNA的一個鹼基,因此,CRISPR實現了最簡潔的DNA識別,堪稱超輕量級的基因組GPS。而這個能力也迅速被用於開發新一代的基因編輯技術。
2005年,就在莫西卡從海量CRISPR序列中發現規律,第一次提出細菌免疫可能性的時候,美國加利福尼亞大學伯克利分校的結構生物學家珍妮弗・杜德納(Jennifer Doudna)也偶然從地球微生物學系的同事吉利恩・班菲爾德(Jillian Banfeld)那裡聽說了CRISPR。某天在校內的“言論自由運動”咖啡館小坐閒聊時,班菲爾德告訴杜德納,她的實驗室從附近鐵礦中發現的許多細菌,也帶有這種神奇的CRISPR序列。
與一心想著解決免疫問題的細菌學家不同,杜德納是功成名就的結構生物學家,長期利用X射線衍射方法研究蛋白質大分子的三維結構。因此,對CRISPR產生興趣的杜德納自然希望利用老本行來探究CRISPR的三維結構,看看它們究竟是怎樣實現對病毒DNA分子的識別的。
但杜德納在幾年內都沒有取得很好的進展。事後想想,她的探索其實是有點超前的。2005年的時候,人們還不知道CRISPR DNA需要先轉錄成較短的RNA分子,才能發揮功能(這一點直到2008年才發現),也不知道CRISPR的真實功能是切割病毒DNA(這一點直到2010年才發現),更不知道CRISPR RNA發揮功能需要一系列與之結合的cas蛋白(這一點也是2008年才發現)。實際上,即便是在2010年,人們已經知道細菌的免疫系統是cas蛋白和幾段RNA的複合體時,杜德納都還沒有找到合適的入手點。2010年,人們發現CRISPR RNA會結合好多個cas蛋白,而解析一個擁有七八個蛋白質分子、好幾段RNA片段的龐大蛋白複合體結構,直到今天在技術層面都還相當困難。
到了2011年,杜德納終於找到了突破口。或者更準確地說,是突破口找到了她。
當年3月上旬,杜德納飛往美麗的波多黎各參加一場由美國微生物學會組織的會議。會議的主題是細菌中的RNA分子——這正是杜德納整個職業生涯一直關注的目標。從濃霧時雨的北加州飛往陽光明媚的加勒比海,杜德納的心情無疑是輕鬆愉快的。直到一位表情嚴肅的女科學家走上前來,輕聲問她:“能出去走走順便請教您幾個問題嗎?”
這個女科學家是任教於瑞典于默奧大學的法國人艾曼紐・卡彭蒂耶(Emmanuelle Charpentier)。這場不期而遇的對話標誌著人類基因治療領域新的起點,毫無異議將被寫入當代科學史(見圖4-9)。
和杜德納一樣,卡彭蒂耶也對CRISPR序列有著特別的興趣,但兩人的研究背景大相徑庭。和結構生物學出身的杜德納不同,卡彭蒂耶受過長期的細菌生物學訓練,對細菌本身所屬的生物學更加熟悉。而在這場海邊的對話中,卡彭蒂耶提到她自己的實驗室在研究一種危險的人類致病菌——化膿鏈球菌——當中的CRISPR序列。她的實驗室發現,細菌中僅僅需要一種cas蛋白(後來大名鼎鼎的cas9,當時的名字還是csn1)和兩段RNA分子,就可以識別和切割病毒DNA!
於是,杜德納和卡彭蒂耶順理成章地開始了她們的合作。對杜德納而言,研究一個蛋白質的結構和功能顯然比研究一大堆蛋白質輕鬆得多;而對於卡彭蒂耶而言,她也非常想從結構生物學的角度,更好地理解cas9到底是如何發揮功能的。兩個相隔萬里之遙的實驗室迅速展開了合作,最終在2014年完美解釋了CRISPR/cas9系統的工作原理。我們可以把cas9蛋白想象成有著兩個卡槽的接線板,卡槽內能夠同時插進一條CRISPR RNA和一條病毒基因組DNA。當插入的CRISPR RNA和病毒DNA的序列一一配對時,cas9蛋白就會發生變形,準確卡住病毒DNA,毫不猶豫地揮起剪刀。這正是細菌免疫系統的工作原理。
在此之前的2012年,兩個實驗室首先證明了CRISPR/cas9系統能夠作為新一代的基因編輯工具。他們對這個系統進行了進一步簡化,把系統所需的RNA從兩條合併成了一條嚮導RNA。與此同時,他們拋開病毒免疫的概念範疇,第一次證明了這個雙組分系統的完全可程式設計性:人工設計的嚮導RNA可以讓cas9蛋白指哪打哪,切割任意指定的一段DNA序列。
而這個時候距離“神話”核酸酶技術的出現也不過短短一年而已!當科學家們還在努力改善“神話”蛋白的組裝方法,生物技術公司還在躍躍欲試準備用“神話”蛋白展開基因治療嘗試的時候,CRISPR/cas9技術的從天而降,宣示了“神話”技術的終結。畢竟這一次,要定位和切割任意一段人類基因組序列,只需要科學家設計幾十個鹼基長度的序列即可,這把基因編輯的工作量一下子減少到原來的1/100!
專利之爭
遺憾的是,2014年4月15日,美國專利與商標局在萬眾矚目中,將與CRISPR/cas9技術相關的第一項專利,授予了張鋒和他所在的布羅德研究所。
後記
2020年12月10日,為表彰卡彭蒂耶和杜德納這兩位女生物學家的卓越貢獻,諾貝爾委員會將本年度的化學獎授予這兩位女科學家。雖然CRISPR基因編輯技術的專利權被其他研究人員搶先獲得,但科學界是有記憶的,兩位女科學家名至實歸!