責編 | Qi
隨著精準醫療和基因測序的發展,癌症分類越來越細化。根據病人臨床或者分子特徵定義的新的亞型越來越多。比如乳腺癌可粗分為ER+, HER2+和TNBC,而TNBC又可以再分為六種亞型。往往抗藥的病人因具有不同的分子特徵而被分開出來針對研究。藥物研發也慢慢開始針對各種亞型。加上各種罕見癌症,新的癌症型別數越來越多。而分配到各特定病人群體的研究資源很有限。大規模的藥物篩選在小的實驗室很難實現。
過去幾十年的基因測序能對各種癌症基因表達精確定義,同時也能對目前臨床藥物對基因調控有了清晰地瞭解。透過匹配疾病和藥物的分子圖譜,我們能快速找到合理的藥物進行進一步實驗驗證。因為很多藥物已經運用於臨床,可以很容易實現藥物再利用(drug repurposing)。來自美國密西根州立大學陳斌團隊開發一種匹配演算法,該演算法能量化每個藥物對特定疾病分子圖譜的校正潛力(命名為RGES)。RGES的核心概念是如果藥物對疾病高表達基因有下調作用而對低表達基因有上調作用,意味著該藥物可能對此疾病有效。陳實驗室和其他實驗室運用此演算法發現了很多候選藥物。比如他們發現抗痢疾藥可能能用來治療肝癌 (PMID:28284560)。他們的研究表明用該演算法來篩選藥物能達到50%的成功率。然而,透過公用資料尋找正確的疾病分子圖譜和合理利用此演算法進行藥物預測對大多數研究人員來說並不簡單。
近日,陳斌團隊在Nature protocols雜誌上發表了一篇題為 OCTAD: an open workspace for virtually screening therapeutics targeting precise cancer patient groups using gene expression features 的文章,公佈其最新開發的系統:OCTAD (http://octad.org/)。
在文章裡,作者詳細敘述了藥物預測的每一步驟, 從早期怎麼選擇合理的病人樣本和匹配的樣本到後期怎麼選擇靶點,評估預測效果和選擇合理的實驗模型。比如他們發現大部分的病人腫瘤樣本沒有直接可以用的正常組織樣本來對比生成分子圖譜。於是他們利用深度學習autoencoder來幫忙從GTEx,一大型正常組織資料庫,來選擇合理的正常樣本。他們也發現好多細胞株雖然跟腫瘤組織來自同一細胞類 (cell of origin) ,但它們的基因表達完全不樣。最明顯的就是MDA-MB-231用來研究乳腺癌轉移的細胞株跟轉移的病人樣本分子特點完全不一樣 (PMID:31092827)。OCTAD也加入了相應一模組來幫助選擇細胞株。
目前,OCTAD收集了19127組織樣本的基因表達資料涵蓋了50多種癌症,每個樣本包括了性別、年齡、癌症階段 (stage)、基因突變 (mutation)、基因複製數 (Copy number variation),常見亞型等資訊。同時OCTAD收集了12442藥物的基因圖譜。OCTAD的網路平臺可以幫助無程式設計背景的人選擇組織樣本計算基因表達圖譜和實驗藥物預測,OCTAD的R軟體包能實現更多樣式的大規模預測。
在文章最後,作者以肝癌為例一步步演示怎麼透過網路版本和R軟體包實現藥物預測。同時他們也用MYC amplification 的肺癌和PIK3CA 變異的乳腺癌來說明OCTAD對癌症特定亞型的藥物預測。OCTAD目前只支援現有藥物的預測。
原文連結:
https://www.nature.com/articles/s41596-020-00430-z
製版人:十一