和開發研製新藥一樣,發現老藥的新用途也是醫藥科研人員和製藥廠商的工作之一。目前,老藥新用的發現途徑多為偶然發現或臨床試驗的方式。但近期,俄亥俄州立大學研究人員開發了一種深度學習的框架,透過定製深度學習框架的方式對大量患者的“真實世界資料(real-world data,RWD)”進行回顧性分析,再結合因果推理來模擬藥物的臨床試驗,為老藥新用提供了新的途徑。
1月4日,該研究以《一個透過在真實世界患者資料上模擬臨床試驗找到藥物新用途的深度學習框架》(A deep learning framework for drug repurposing via emulatingclinical trials on real-world patient data)為題發表在《自然機器智慧》上。
儘管該項研究是以預防冠心病患者出現心臟衰竭和中風為出發點而提議的老藥新用,但張平對 DeepTech 表示,該框架具有高度的靈活性,可以同理應用於大多數疾病研究中。“該框架理論上是可以用於尋找可能的新冠肺炎藥物的,但這項研究進行的時候還處於新冠爆發初期,資料不足以支撐”。
用深度學習框架分析資料,模擬藥物的臨床試驗目前獲得藥物新用途通常需要進行偶然性藥物測試,但這種隨機性的臨床試驗不僅十分耗時,而且成本昂貴。據 MedicineNet 資訊顯示,在美國,一款藥物從實驗室研究到市場應用,需要經過多重複雜嚴謹的試驗,平均來說,這個過程長達 12 年之久。
其過程中,隨機臨床試驗是確定藥物對疾病有效性的黃金標準。相比其他老藥新用的研究方法,全新的深度學習方法可以理解為用監測患者用藥以及用藥後病情發展、身體各項資料變化的方式來模擬藥物的臨床試驗這一環節。張平表示,基於 RWD 的深度學習框架能夠有效克服資料中各種各樣的干擾變數,建立老藥和新的適用症之間的聯絡。
具體而言,他們是按照臨床試驗的思路開發了一套高通量的計算框架來篩選既有藥物尚未發現的適用症,達到將臨床試驗這一發現老藥新用的過程“搬到”線上。
以模擬臨床上對藥物是否對症以及效果的試驗。在近日發表的這篇論文中,以冠狀動脈疾病(coronaryartery disease,CAD)為例,張平及其合作者從大量的保險資料中提取患者的病情發展及用藥成分清單,同時對每種藥物對應的服用者和非服用者進行監控,觀察服用不同藥物患者的用藥以及病情發展情況。
圖|發現既有藥物新用途的計算框架
以近期發表的研究論文為例,張平及其合作者將在已有但未表明可治療為冠狀動脈疾病(coronaryartery disease,CAD)的藥物中尋找對 CAD 有效的藥為目標,採用上述框架進行了超大規模的計算和分析。
已知 CAD 在臨床上可能導致心衰、中風等,如患者服用了目前未標明 CAD 這一適用症的藥物出現了病情好轉,既可初步認為這款“老藥”其具有“新用(治療 CAD )”的可能。
首先,為儘可能保證輸出結果的可信度,他們從 2012-2017 年間的 MarketScan 商業理賠的患者資料中獲取了約 1.07 億位患者的身體健康資料作為此次計算分析的整體。資料包括門診用藥、住院治療和門診服務等方面,涵蓋了患者看診/複診時間、用藥清單及劑量等。為實現其發現治療 CAD 新藥的目標,張平等人從中篩選出了 117.9 萬左右 CAD 患者展開進一步“監控”。他們從這些樣本資料中提取 CAD 患者用藥清單的記錄,對每種候選藥物按照臨床試驗的分析方法而分為:實驗組——也就是那些吃了該候選藥物的 CAD 病人,對照組——身體基礎情況類似但沒有吃該候選藥物(而是吃了一些隨機的其他藥物)的病人。
圖 | 模擬臨床試驗中實驗組和對照組
此次研究中,他們選取了 CAD 患者服用的 55 種非治療 CAD 的藥物作為“老藥新用”候選藥物進行分析。篩選出參與“臨床試驗”的 CAD 患者後,將患者服用的 55 種藥物作為候選藥物輸入上述計算框架中。接下來開啟對服用候選藥物的患者和與對照組患者進行病情發展情況的監測,包括所觀察患者的初始疾病狀況、是否服藥、服用了哪些藥以及何時開始治療等資料,用資料來對現實生活中藥物的臨床試驗進行模擬。
經過張平等人設計的深度學習框架計算,未出現心衰、中風或症狀較輕的患者所服用的藥物將作為結果輸出,既為老藥新用的“種子選手”。
文中結果顯示,張平及其合作者觀察到 55 種候選藥物中有 9 種藥物對患者的疾病產生了有益的作用。值得注意的是,在目前已知的4種用於治療的 CAD 藥物中,他們篩選出的 9 種藥物中含有 3 種。
圖|候選藥物對CAD效果顯示
為驗證另外 6 種目前尚未指定用於治療 CAD 的候選藥物對 CAD 是否有效,張平及其合作者展開了進一步分析。他們用使用者和非使用者觀察結果的加權平均數ATE(average treatment effect)來衡量候選藥物對 CAD 效用。根據定義,ATE小於 0 的藥物被視為對相應病症有改善效果,即未表現出心衰或中風症狀或症狀表現輕於未服用藥物的患者;大於 0 則為病情惡化。從上圖可見,ATE 小於 0 的有 9 個,其中此前未用於治療該病症的藥物標為藍色,已知藥物為紅色。這表明了張平小組所設計框架思路的可行性。
除此以外,他們還透過分析驚喜地得出,現在正用於治療糖尿病的藥物二甲雙胍和治療抑鬱症、焦慮症的藥物依地普侖也表現出能夠降低 CAD 患者心衰和中風的風險。目前,研究人員正在進一步測試這兩種藥物對 CAD 的療效。
發現老藥新用結果可靠,但也存在弊端深度學習框架方法的可用性在以上研究中得到了印證,相比於傳統的老藥新用途發現方式存在偶然性以及前期測試成本高等不足,這種全新的途徑有著自身的優勢,但也並非沒有缺陷。
儘管,相比於傳統的在細胞或動物體的前期測試方式,基於 RWD 的深度學習研究獲得的結果是直接從人體環境下完成的,省去了藥物適應性的驗證過程;深度學習框架下透過嵌入模組、遞迴神經網路和預測模組方式對所有影響藥效的引數進行分析。
圖|嘈雜因素淨化處理
不過,張平也表示,深度學習方法雖然看起來完美,但在現實執行起來也存在一些不可避免的問題。因為現實很有可能並不如資料顯示的那樣,“比如病人可能會不按照劑量去吃藥,甚至拿了藥回去根本就沒有吃等情況都是有可能的,這是從資料上無法看出來的。”在這一點上,深度學習方式無法和現實臨床試驗相比,真正的臨床試驗中精準控制患者的服藥時間和劑量,至少在這方面臨床上的嚴格服藥把控能夠更完全地體現藥效。
但這種深度學習框架的方式也為老藥新用的發現提供了新的途徑,張平說,“我們是第一個開發深度學習的方法在 RWD 上做老藥新用研究的團隊”。
用AI模擬臨床試驗,由計算機學生和藥廠的碰撞產生本篇研究論文的通訊作者張平,其本碩博所修專業均為計算機方向,機器學習是他的主修課程,資料探勘為他的研究方向。談及對老藥新用的接觸,其實是有些巧合的。
張平接觸老藥新用是在其讀博期間。結束了華中科技大學的本、碩學習後,張平在天普大學開啟了他的博士生涯。期間,機緣之下他去到一家制藥公司葛蘭素史克(GSK)實習。也是在 GSK ,在用機器學習的方法解決問題時,張平接觸到了老藥新用,他回憶道,“那大概是 10 年前了,那時候深度學習還沒有開始流行”。而接觸 RWD 則是其在 IBM T.J. 沃森研究中心了,張平在那期間的多個 AI 研究後來也被應用於藥物發現和患者安全的專案裡。
圖|張平
但真正開啟 RWD 和深度學習在老藥新用方面的研究是在他到俄亥俄州立大學之後。“實際上,俄亥俄州立大學同時擁有優秀的醫學院和工程學院,這裡豐富的資料資源是我以完全不同的視角重新做老藥新用研究的機緣。”
2019 年初,張平加入俄亥俄州立大學在生物醫學資訊學系和計算機科學與工程系雙聘助理教授。他領導的醫學人工智慧實驗室——AIMed,其實驗室的名字也有特殊的含義,“aimed翻譯為中文可以是致力、目標的意思,我們組致力於 AI 演算法的同時目標是解決醫學(medicine)上的各種疑難問題,這裡也取其一語雙關的意思。”目前,AIMed 實驗室主要進行三大方向的研究:一是本文中提到的用以輔助醫藥研發人員、製藥廠老藥新用的篩選;二是幫助醫生做基於 AI 的醫療診斷;三是用 AI 去輔助放射科醫生對醫療影像進行解讀。
談及此次研究論文的一作劉若琦,張平對 DeepTech 說,“她完成這個研究的時候才博士一年級,這是個非常不錯的成果。”另外他也提到其實“這些學生挺辛苦的,剛入學不久就趕上疫情。我們也不能回學校,溝通都是在線上。”劉若琦本科就讀於武漢大學,現在已經是俄亥俄州立大學計算機科學與工程系博士二年級的學生,據其個人介紹顯示,她的研究興趣集中在資料探勘、因果推論及其在醫療保健中的應用上。
圖|劉若琦
另外,在本次研究中至關重要的資料統計以及結果分析,由俄亥俄州立大學生物醫學資訊學系研究助理教授魏萊參與完成。魏萊老師同時也是該校生物統計學中心臨床試驗主管,負責對多個度量值進行建模,並設計小組順序試驗和自適應試驗。其重點研究適應性臨床試驗設計和樣本大小重新估計實驗。
圖|魏萊
對於深度學習方法在老藥新用方面的探索,張平表示,“雖然此次釋出的文章中只提到了對 CAD 藥物的篩選,但這一框架是普適的,能用於對任何一種病症的藥物篩選,只要輸入相應的症狀即可。”