CRISPR-Cas9可以很容易地敲除或調整單個基因,以確定其對有機體或細胞,甚至另一個基因的影響。但是,如果你能一次進行幾千個實驗,利用CRISPR逐個對基因組中的每一個基因進行調整,並快速看到每一個基因的影響呢,那會怎麼樣呢?
在一項新的研究中,來自美國加州大學伯克利分校的研究人員開發出一種簡單的方法來做到這一點,它讓任何人都可以對細胞(包括人類細胞)進行分析,並迅速確定基因組中所有調控特定基因表達的DNA序列。相關研究結果發表在2020年12月11日的Science期刊上,論文標題為“CiBER-seq dissects genetic networks by quantitative CRISPRi profiling of expression phenotypes”。
雖然這項技術將主要受益於對影響感興趣基因的遺傳網路進行追蹤的基礎研究人員,它也將幫助人們快速找到控制疾病基因的調控序列,並可能找到新的藥物靶點。
CiBER-seq原理示意圖,圖片來自Science, 2020, doi:10.1126/science.abb9662。
論文通訊作者、加州大學伯克利分校分子與細胞生物學副教授Nicholas Ingolia說,“你可能想要使用這種方法的疾病是癌症,在癌症中,我們知道癌細胞為了生存和生長而表達且是需要表達的某些基因。這個工具會讓你問問題:上游基因是什麼,哪些是我們知道的控制這些基因的調節因子?”
這些調節因子可能更容易透過藥物加以靶向以關閉癌細胞。這種新技術簡化了一些直到現在都很難做到的事情:沿著細胞中的遺傳途徑回溯,以找到這些最終的調節因子。
他說,“我們有很多向前工作的好方法。這是一種很好的逆向工作的方法,可用於弄清楚一些東西的上游是什麼。我認為它在疾病研究方面有很多潛在的用途。”
他補充道,“我有時會打個比方,當我們走進一間黑暗的房間,按一下電燈開關,我們就能看到開啟的是什麼燈。這個燈就像一個基因,當我們按下開關,我們就能知道它開啟了什麼基因。我們已經在這方面做得很好了。這讓我們可以做的是逆向工作。如果我們關注一個燈,我們想知道控制它的開關是什麼。這給我們提供了一種方法來做到這一點。”
Ingolia實驗室的研究生Ryan Muller及其同事Lucas Ferguson、Zuriah Meacham與Ingolia在Science期刊上發表了他們開發的這種技術的細節。
對基因組進行條碼化處理
自從8年前CRISPR-Cas9基因編輯技術出現以來,想要確定某個特定基因功能的科學家們已經能夠用Cas9蛋白精確地靶向該基因並將其敲除。在一段與該基因中的DNA互補的嚮導RNA(gRNA)的引導下,Cas9蛋白結合並切割該基因,或者像CRISPR干擾(CRISPRi)那樣,抑制它。
在最簡單的測試中,細胞或有機體要麼生存,要麼死亡。然而,可以尋找基因敲除的更微妙的影響,例如特定基因是否開啟或關閉,或者它被調高或調低了多少。
如今,這需要新增一個報告基因--通常是一個編碼綠色熒光蛋白的基因,所新增的報告基因連線到啟動你感興趣的基因表達的啟動子的相同複製上。由於每個基因獨特的啟動子決定了該基因的表達時間,如果Cas9基因敲除影響了你感興趣的基因的表達,也會影響報告基因的表達,使細胞培養物在熒光燈下發綠光。
儘管如此,酵母的全部基因有6000個--而人類的全部基因有2萬個---要調整每個基因並發現對熒光報告基因的影響是一項大工程。
他說,“CRISPR使得全面調查基因組中的所有基因並對它們進行擾動變得很容易,但隨後最大的問題是,你如何讀出每個擾動的效果?”
這種新技術,Ingolia稱之為CiBER-seq(CRISPR interference with barcoded expression reporter sequencing),解決了這個問題,透過讓數萬個CRISPR實驗合併在一起,同時完成這些實驗。該技術摒棄了熒光,採用深度測序的方式,直接測量合併樣本(pooled sample)中基因活性的增加或減少。深度測序採用高通量、長讀的新一代測序技術,對合並樣本中表達的所有基因進行測序和基本計數。
Ingolia說,“在合併的CiBER-seq實驗中,在一天之內,我們可以找到幾個不同靶基因的所有上游調控因子,而如果你要使用基於熒光的技術,每一個靶基因都需要你花費多天的測量時間。”
對生物體內的每個基因進行平行CRISPR分析是很直接的,這要歸功於那些出售現成的、與Cas9蛋白一起使用的單向導RNA(sgRNA)的公司。科學家們可以為基因組中的每個基因訂購sgRNA,為每個基因可以訂購十幾種不同的sgRNA---大多數基因都是由數千個核苷酸組成的,而sgRNA的長度大約為20個核苷酸。
Ingolia團隊的關鍵創新是將每個sgRNA與一個獨特的、隨機的核苷酸序列---本質上是一個條形碼---連線到啟動子上,只有當感興趣的基因也被開啟時,該啟動子才會轉錄條形碼序列。每個條形碼可報告一個sgRNA的效果;在成千上萬個sgRNA的複雜文庫中,一個sgRNA靶向作用於一個基因。深度測序可以告訴你樣品中每個條形碼(對酵母而言,大約有6萬個條形碼)的相對丰度,讓你快速評估酵母中6000個基因中的哪一個對啟動子有影響,從而對感興趣的基因的表達有影響。對於人類細胞來說,可能會插入20多萬個不同的gRNA,多次靶向作用於每個基因。
他說,“這才是我們能夠做到與眾不同的關鍵:你有一個由不同的gRNA組成的大型文庫,每一個gRNA都會擾動不同的基因,但它上面有同一個查詢啟動子(query promoter)--你正在研究的反應。這個查詢啟動子轉錄了我們連結到每個gRNA的隨機條形碼。如果存在一個你關心的反應,你就干擾一下基因組中的每個不同基因,看看這種反應是如何變化的。”
例如,如果你得到的一個條形碼比其他任何一個條形碼都要豐富10倍,那就告訴你該查詢在細胞中被強烈開啟了10倍的啟動子。在實踐中,Ingolia在每個gRNA上附加了大約四個不同的條形碼,作為對結果的四重檢查。
他說,“透過更直接地觀察基因表達反應,我們可以發現很多微妙的生理學本身,細胞內部發生了什麼。”
在這些新報道的實驗中,Ingolia團隊查詢了酵母中的五個不同基因,包括參與新陳代謝、細胞分裂和細胞應激反應的基因。雖然在對整個基因組進行CRISPR分析時,可能會同時研究多達100個基因,但是他猜測,為了方便起見,科學家們會將自己的研究範圍限制在一次四五個基因。
參考資料:
1.Ryan Muller et al. CiBER-seq dissects genetic networks by quantitative CRISPRi profiling of expression phenotypes. Science, 2020, doi:10.1126/science.abb9662.
https://science.sciencemag.org/content/370/6522/eabb9662
2.Using CRISPR, new technique makes it easy to map genetic networks
https://phys.org/news/2020-12-crispr-technique-easy-genetic-networks.html