作為醫療大資料行業的一個標杆模式,個性化醫療服務(personalized medicine)和與之配套的資料分析服務在美國已經逐漸升溫。資料在美國,醫療資料的主要擁有方是醫院以及保險公司。資料內容則包括體檢測試資料如血壓、體重,患病歷史資料,曾用藥物資料,醫生診療資料,以及部分基因資料。目標個性化醫療服務的目標即是定製個性化的治療和理療方案,具體而言有三點:1.透過病史資料分析,提出對用藥種類、劑量的建議2.根據治療決策和病人反饋,動態規劃下一步治療措施3.對潛在慢性病進行預判和預警現狀目前個性化醫療相對成熟的醫學領域主要是慢病和保健領域。這些領域的疾病往往是日積月累形成的,而非偶然性事件或事故,因而病史資料指示性強。模型那麼大資料分析如何應用於個性化診療呢?我們設訓練資料:病史資料為S,曾用診療措施為X,療效反饋為Y模型輸入:新病人的病史資訊S"模型輸出:治療方案建議為X"傳統方法會把這個問題看成分類問題,用S和X建立預測Y的函式,並在此基礎上利用S"產生最理想的X"。但是病人的治療方案不是一次性決策,而是一個動態問題。所以應先提出治療措施,觀察一段時間療效如何,再進一步調整治療手段,不斷動態最佳化方案直至病人康復。即S1→X1→S2→X2→S3→X3那麼,這個問題應建模成為Sequential decision problem技術難點根據病史資料、診療資料和療效資料實現個性化醫療保健的技術難點在於醫療資料的稀疏性。即對於一種病,病人的併發症只有幾種,但是醫學上的分類症狀(ICD9)有幾十萬種,因而特徵向量非常稀疏。而且單個症狀不具有指示性,因而關於某種疾病,需要透過症狀聚類進行降維。我們來看一個案例,美國Meridian Health旗下控制了十餘家醫院、醫療中心和醫學實驗室,其總部位於紐澤西州。其希望透過積攢的病史資料、診療資料和療效資料實現膝蓋的個性化醫療保健。在這種情況下,我們可以進行Total knee and hip replacement diagnosis clustering。即透過分析症狀之間的相似性定義特徵網路,進而進行community detection。透過理療措施之間的相似性進行聚類,相當於治療方案空間上的粗粒化。隨後在優質特徵上使用contextual bandit方法。即要學習的不是某個最好的治療手段(classical bandit),而是S→X的函式空間中的最優空間(contextual bandit)。同時模型需要能夠基於歷史資料建立先驗機率(Prior)。而在Exploration vs. Exploitation中,應盡力避免過多探索,即較為不理性的治療方案。
作為醫療大資料行業的一個標杆模式,個性化醫療服務(personalized medicine)和與之配套的資料分析服務在美國已經逐漸升溫。資料在美國,醫療資料的主要擁有方是醫院以及保險公司。資料內容則包括體檢測試資料如血壓、體重,患病歷史資料,曾用藥物資料,醫生診療資料,以及部分基因資料。目標個性化醫療服務的目標即是定製個性化的治療和理療方案,具體而言有三點:1.透過病史資料分析,提出對用藥種類、劑量的建議2.根據治療決策和病人反饋,動態規劃下一步治療措施3.對潛在慢性病進行預判和預警現狀目前個性化醫療相對成熟的醫學領域主要是慢病和保健領域。這些領域的疾病往往是日積月累形成的,而非偶然性事件或事故,因而病史資料指示性強。模型那麼大資料分析如何應用於個性化診療呢?我們設訓練資料:病史資料為S,曾用診療措施為X,療效反饋為Y模型輸入:新病人的病史資訊S"模型輸出:治療方案建議為X"傳統方法會把這個問題看成分類問題,用S和X建立預測Y的函式,並在此基礎上利用S"產生最理想的X"。但是病人的治療方案不是一次性決策,而是一個動態問題。所以應先提出治療措施,觀察一段時間療效如何,再進一步調整治療手段,不斷動態最佳化方案直至病人康復。即S1→X1→S2→X2→S3→X3那麼,這個問題應建模成為Sequential decision problem技術難點根據病史資料、診療資料和療效資料實現個性化醫療保健的技術難點在於醫療資料的稀疏性。即對於一種病,病人的併發症只有幾種,但是醫學上的分類症狀(ICD9)有幾十萬種,因而特徵向量非常稀疏。而且單個症狀不具有指示性,因而關於某種疾病,需要透過症狀聚類進行降維。我們來看一個案例,美國Meridian Health旗下控制了十餘家醫院、醫療中心和醫學實驗室,其總部位於紐澤西州。其希望透過積攢的病史資料、診療資料和療效資料實現膝蓋的個性化醫療保健。在這種情況下,我們可以進行Total knee and hip replacement diagnosis clustering。即透過分析症狀之間的相似性定義特徵網路,進而進行community detection。透過理療措施之間的相似性進行聚類,相當於治療方案空間上的粗粒化。隨後在優質特徵上使用contextual bandit方法。即要學習的不是某個最好的治療手段(classical bandit),而是S→X的函式空間中的最優空間(contextual bandit)。同時模型需要能夠基於歷史資料建立先驗機率(Prior)。而在Exploration vs. Exploitation中,應盡力避免過多探索,即較為不理性的治療方案。