科學故事 | “林奇綜合症”背後的科學故事,兼談“家族性大腸癌”基因檢測“不確定突變體”問題的系統性解決辦法
這個故事每字每句都真實,而且很有傳奇色彩。有一位美國醫生叫Clement Richard Boland 【1】,他的聰明才智足夠讓他進入耶魯大學醫學院,本應前途光明,然而他卻有一個揮之不去的心理負擔:他時刻覺得自己可能活不過30歲。之所以那麼認為,因為他的父親,26歲就患了腸癌,49歲時就不幸去世。他父親有個妹妹,27歲時就因病去世。Boland醫生同樣瞭解到,他的祖父,曾祖父,都因腸癌去世。帶著這樣的負擔,他訪遍當時(1970年左右)認識的所有醫生、教授,告訴他們自己家族有一種“家族式”腸癌。但是沒有人能幫到他,甚至沒有人相信他。當時的頂級專家們都不知道“家族性癌症”這回事。他的教授們只能告訴他,他的家人只是“運氣不好”(bad luck)而已。直到1972年,Boland醫生認識了Dr. Henry Lynch (圖1)。Lynch(林奇)醫生是第一個發文章正式描述“家族性癌症”的科學家【2】。在當時很少有人相信他,以致在此後的20年裡,他寫的基金申請大部分都沒拿到錢。但真正的科學發現終不會被埋沒!隨著生命科學技術的飛速發展,越來越多的證據表明“家族性癌症”的存在,以及其最基本的原因—基因突變。上世紀90年代中期(不過25年前),Boland醫生也在自己的實驗室,讓家族的“病魔”顯了原形。他的家族DNA裡, 一個抑制癌症的基因(MSH2),大段缺失,讓他們得大腸癌的機率,高達80%。再後來,經Boland醫生的建議,這種型別的“家族性大腸癌症”被正式命名為Lynch Syndrome (林奇綜合症)。2019年,Lynch醫生以“遺傳性癌症之父”的尊稱去世,享年91歲。Boland醫生雖已年逾70歲高齡,依然活躍於醫學和科研的第一線,時有署名文章發表。
圖1:Boland 和Lynch醫
Lynch Syndrome (林奇綜合症)
時至今日,林奇綜合症的發病機理已經研究得非常清楚。林奇綜合症通常由人體的DNA修復錯配基因(DNA mismatch repair : MSH2, MLH1, MSH6, PMS2)的致病突變造成【3】。這四個基因負責修復DNA複製過程產生的“錯誤”(突變)。人體的DNA聚合酶(DNA polymerase)其實非常精確,犯錯的機率大概只有一億分之一(10e-8)。但人的DNA有30億對鹼基,所以每次細胞分裂還是要造成大概30處突變的。如果任由聚合酶這樣犯錯,人類這個物種根本不可能穩定地傳宗接代。好在細胞還有DNA錯配修復系統在DNA鏈上“巡邏”,檢查並修復這些錯誤。普通人的細胞都有兩套染色體,一套來自母親,另一套來自父親,這保證在大多數情況下,支撐生命的重要基因都在細胞裡有備份。然而有一些人,生來是帶有基因突變的。如果不幸從父母一方遺傳了DNA錯配修復系統裡,四個基因(MSH2, MLH1, MSH6, PMS2)中任何一個基因的功能喪失突變 (loss-of-function mutation),就會導致林奇綜合症。林奇綜合症的遺傳模式是常染色體顯性遺傳(autosomal dominant inheritance),也就是說:只要一套染色體內有這幾個基因的突變,就是林奇綜合症患者。有人可能會問:不是還有另一套染色體正常行使功能嗎?的確是。但人生是個漫長過程,隨著人出生、長大、成年、變老,人體DNA會不可避免遭受輻射、毒素、酒精、壓力等侵害,以致造成基因突變。普通人有兩套DNA修復基因,偶爾損失了一副,細胞也能承受。但如果生來就帶有一半的突變,因另一半受破壞以致全部功能缺失的機率就大大增加。林奇綜合症患者在70歲前得大腸癌或子宮癌的機率高達80%。因為漫長的人生歲月裡,說不定哪天就失去了DNA修復功能,聚合酶的錯誤突變飛速累積,最後發展成癌症。全球無論國家種族,大概每300個人裡就有一個林奇綜合症患者。這個患病率其實非常高了。試想這篇文章如果有3萬人讀到,讀者中就有100個林奇綜合症患者,他們40歲50歲時就有非常高的機率得腸癌。中國人也不例外,這裡有一篇國內關於Lynch Syndrome的新聞報道:一家五代人竟有10人先後患癌!
怎麼診斷林奇綜合症?
一個人如何知道是否是林奇綜合症的患者呢?最簡單的辦法是:看家族史。也就是看父母、祖父母、叔叔姨媽、唐兄妹表兄妹有沒有得癌症的。如果父母(必須是親生的)都有幸高齡(>80歲),且沒有得過癌症,那麼遺傳林奇綜合症的機率很低。當然不是說不會得癌症,只是說得遺傳性的癌症的可能很小 。沒有遺傳因素,由一生的環境因素(比如吸菸)導致癌症的可能也很大。然而家族病史不是絕對的,因為人這個生命是很複雜的。如果要非常確定地診斷是否有林奇綜合症,就需要醫學級基因檢測。高質量的基因檢測能幾乎100%知道一個人DNA裡有沒有導致林奇綜合症的突變。需要強調一下,免得誤解,上句的核心是“100%知道有沒有突變”,不等於100%得癌症!這裡有至少兩層意思:1,有的突變,是中性的,無害的,DNA裡有也能正常過一輩子。2, 很多的突變是有害的,但有害的也未必100%得癌症。因為林奇綜合症的“外顯率”(penetrance)並不是100%。林奇綜合症方面的基因檢測,跟乳腺癌相關的BRCA1/2的基因檢測很相似。雖然DNA錯位修復系統基因的篩查,在普通大眾中不如乳腺癌BRCA基因篩查出名,但在人群裡的發病率很相似,在學術界也有重要意義 。林奇綜合症一旦確診,有非常成熟的干預、預防和癌症早篩手段 。正因為如此,在發達國家,林奇綜合症的相關基因檢測已經慢慢成為醫院的常規篩查。比如美國醫生會推薦所有的腸癌患者進行基因檢測。一旦確定是林奇綜合症,同樣會讓可能受影響的子女,親屬進行基因檢測。精準診斷,精準預防和干預,也是精準醫療的精髓所在。
基因檢測的VUS問題
隨著測序技術的發展進步和測序價格的持續下降,越來越多的人透過醫生或者自掏腰包進行基因檢測。病人測序資料的獲得已經變得越來越便宜,但對大量的資料進行分析解讀卻依然是很大的挑戰。正如前文所說,基因檢測只能告訴病人有沒有DNA突變,很多時候卻不能準確預知病人會不會因此得癌症。因為就算在重要的基因上,很多突變可能是中性無害的。對很多的突變來說,醫生和科學家都沒有辦法判斷這些突變是致病還是中性無害。如果是致病突變而醫生不做什麼,那麼病人會得癌症;但如果是中性無害突變而醫生進行了不恰當的干預,比如切除子宮,這樣的結果也很難讓人接受。這些在基因檢測裡發現的,但沒有確定是否是有害的突變,在醫學上稱為“不確定變體” (Variant of Uncertain Significance),或者VUS。VUS因為不確定性,通常會給醫生和病人雙方都造成極大焦慮。對林奇綜合症來說,ClinVar【4】裡錯義突變的VUS的佔比高達九成(圖2)。我們正是為了系統性地解決林奇綜合症基因檢測的VUS問題,而開展了這項研究【5】。
圖2: ClinVar資料庫裡,Lynch Syndrome VUS佔比大約90%
系統性測量林奇綜合症MSH2基因的所有突變
圖3: 12月23號online的文章標題
傳統上對不確定變體(VUS)進行判斷的標準做法是:從病人身上提取突變樣本à實驗室進行克隆à把病人的突變放進人的細胞或酵母細胞裡進行功能性分析à確定VUS是否致病。這樣的工作雖然卓有成效,解決了小部分VUS的判定問題,但實在太費時費力,已經無法滿足不斷增長的病人資料分析需要。我們實驗組決定一次性,系統性地解決林奇綜合症錯意突變的VUS判定問題。運用最新的DNA合成和高通量測序技術,結合分子生物學手段,建立了一個高通量的系統,能測定林奇綜合症基因所有可能的錯義突變。所有的錯義突變是多少呢?拿此次剛剛發表的MSH2基因舉例。MSH2有934個氨基酸,每個氨基酸對應MSH2基因的一個密碼子。每個鹼基有四種可能,所以每個密碼子(codon)三個鹼基就有64種組合。如果每次突變一個密碼子,那突變整個基因的所有可能組合是934x63=58,842個。這正是我們所做的。我們合成並克隆了MSH2基因突變的所有58,842種cDNA突變可能,並對每一個可能進行了嚴格的實驗測量。當然測量是透過高通量並行測序完成的。最後透過資料分析,把DNA測量的結果翻譯到氨基酸水平上,報告每一種突變是否是致病突變。基因突變的整體畫卷可以透過熱圖的方式呈現(圖4)。紅色代表有害突變,藍色代表中性突變。
圖4: MSH2所有突變對蛋白功能影響的高通量測量
大的熱圖太密集,看不清細節。圖5選取了其中的一段放大,重新做圖,展示細節。X軸上標示氨基酸的位置,Y軸上標示突變後的氨基酸。一次整個蛋白只突變一個位置,紅色方塊表示該突變有害,藍色表示中性。A636P是猶太人裡非常常見的一個致病突變,在我們的測量裡沒有意外,非常明顯的有害突變。
圖5: MSH2 突變-功能關係熱圖節選
當我們做完實驗,處理完資料後首先問自己的一個問題是:這種批次測量得到的資料準確嗎?為此我們查閱了MSH2突變功能性測量的大量文獻 – 其實是能找到的所有歷史文獻。即便如此,因為之前一個個做實驗太費時費錢,我們總共也就找到了165個,其中158個跟我們的測量結果吻合,95.8%。這是非常高的吻合度,考慮到之前的資料由很多實驗室,在不同時間,用不同方法獨立完成。即便其中7例不同的情況,我們也懷疑之前的研究可能因為採用的實驗系統不理想,做錯了。總之,圖6A的比較給我們吃了定心丸。
圖6: 本研究結果跟“黃金標準”結果比較
這項研究的目的是為了最終在臨床上給病人身上的突變做指導。所以,我們同樣也跟ClinVar(現在最常用的基因檢測資料解讀資料庫)上專家稽核後的“黃金標準”判定進行了比較(圖6B)。總共65個突變,62個專家判斷跟我們的結果吻合。敏感性達95.3%,特異性達到95.5%。這就表明我們的測量結果用於臨床上的診斷會非常準確。事實上ClinVar資料庫裡,專家能解讀的突變數量非常有限(65個),而因證據不足不能解讀只能標示為VUS的數量則高達1374個。這些都是在以往的基因檢測報告裡出現在病人身上的突變!而我們的資料可以馬上為這些病人提供非常可靠的答案。ClinVar資料庫裡的突變,只是之前做過林奇綜合症基因檢測的人。世界上絕大多數到現在都沒有做過基因檢測。該研究對未來的價值在於:我們已經測量了數學意義上MSH2這個基因的所有突變,就算未來有人走進診所,發現了一個ClinVar資料庫裡不存在的新突變,也同樣可以使用我們的結果,作為非常準確的參考。用這種窮舉的方法來對基因的突變進行功能性研究在目前還只處在起步階段。本項研究建立起的方法體系的價值,遠遠大於MSH2所有突變的測量結果本身。可以確定是,這個實驗系統可以直接應用於林奇綜合症的其他3個基因(MLH1, MSH6, PMS2)。而加以調整,同樣可以適用於人類疾病相關的大多數基因。當然這個方法也有不完美的地方:首先,就是工作量比較大,一次只能用於研究一個基因。所以科研產能暫時來說是線性增長,也許未來能透過系統最佳化和機器人運用實現指數增長。其次,因為這個系統選擇cDNA為模版突變,所以沒有辦法識別透過影響基因剪接而致病的突變。不過影響剪接的突變在大多數情況下,所佔比例非常非常低。
對蛋白結構-功能關係分析的價值
以上描述了該項研究在臨床上的應用價值,但該研究,對基礎研究,特別是蛋白質結構和功能關係的研究也有非常大的價值(圖7)。比如可以把我們得到的資料跟已經解析出來的MSH2蛋白結構有機結合,來看單氨基酸突變對功能影響在結構上的解釋。比如MSH2蛋白有個很重要的ATPase結構域【6】,這個區域的幾乎所有對原氨基酸的改變都會讓蛋白失去DNA修復功能。而另一些區域,功能則不那麼重要,幾乎所有的突變都不會對功能產生影響。
圖7: 蛋白結構-突變-功能三方結合的綜合性分析
還有一些其他比較有趣也符合預期的觀察。Proline(脯氨酸)總體來說,是蛋白質“最不能忍”的突變,由於脯氨酸在旋轉自由度的限制,很多變成脯氨酸的突變都是有害突變。而一般疏水氨基酸變成另一個疏水氨基酸則對蛋白功能不會有太大影響。MSH2在第二個功能域有一處疏水核心,該疏水核心的突變就會破壞蛋白的功能。比較有意思的是,疏水核心的周圍有很多 Alpha螺旋結構,Alpha螺旋靠近核心一側的氨基酸,基本不能容忍突變,但遠離核心那一側的氨基酸,幾乎不在乎是否有突變。這裡有很多不錯的線索可以在未來進一步追蹤研究。實驗室暫時人力資源有限,也許未來可以跟結構生物學的專家合作來進行更多的分析。用基因檢測來精準確診的意義最後想利用這個機會表達一個觀點。因為經常有人問這個問題:現在癌症又不能保證治癒,我檢測了,知道了自己帶有癌症基因突變,除了增加煩惱外,有什麼用?這代表了很多人的想法。不過我想至少有三方面的原因,知道了比不知道好。凡事預則立,不預則廢。知道資訊本身就是一種力量。有了資訊你才知道自己面對的是什麼。風險幾何?多少歲可能病發?平時飲食需要注意的?最新的科研進展是什麼?人類文明的進步就是不斷地掌握更多更準確的資訊,指導行動。預防。癌症發現得早和發現得晚,治療效果是有極大不同的。如果一個人知道自己有高發腸癌的基因突變,就可以每年去做一次腸鏡檢查。腸鏡檢查雖然不舒服,但除了心理不適,對人體健康沒有侵害。一旦發現了癌症的早期症狀,就能早早治療,存活率能極大提高。有些預防手段雖然有些極端,比如因為攜帶BRCA基因突變而做雙乳切除手術,普通人可能下不了決心。但如果像安吉麗娜·朱莉那樣看到自己母親因癌症去世,可能會有另一層的體會。下一代。最新的體外受精技術,已經能讓父母選擇自己的後代基因。如果你不幸攜帶有致癌突變,透過體外受精(IVF)的辦法,能避免傳給下一代。因為遺傳的機率是50%,你在科學指導下選出那個不受影響的受精卵,就能讓後代不再承受這一輩生而就有的風險。
原文連結:
https://www.sciencedirect.com/science/article/pii/S0002929720304390