一項研究資料顯示,使用中國女性妊娠12周前的臨床資料,基於機器學習和人工智慧(AI)的計算機模型成功預測了其妊娠糖尿病狀態,比既往模型預測時間早2個月。
上海交通大學醫學院附屬國際和平婦幼保健院He-Feng Huang博士表示,既往預防妊娠糖尿病時,臨床醫生只關注伴有肥胖、妊娠糖尿病史或妊娠早期血糖升高的孕婦。現在透過預測模型擴大了目標人群範圍,這將使更多高危孕婦能夠潛在獲益。
研究者使用2017年產科資料庫的電子病歷資料,分析了16 819例診斷為妊娠糖尿病的女性病歷,選擇早期妊娠糖尿病預測的變數如社會人口學特徵、妊娠早期的臨床變數和實驗室指標。為了對預測模型進行評估,研究人員隨後對2018年產科電子病歷中14 992例女性(測試組)資料進行了分析。
研究者使用機器學習變數選擇方法篩選妊娠糖尿病早期發生的風險因素。在抽取的73個變數中,17個變數被選擇用於研究模型,其中包括社會人口資料、臨床特徵、糖代謝、脂代謝和甲狀腺功能。在17個變數中,根據變數內相關性和臨床重要性選擇了7個變數:年齡、一級親屬糖尿病家族史、多次妊娠、妊娠糖尿病史、空腹血糖、HbA1c和甘油三酯。研究者使用先進的機器學習方法,使用7個變數資料集和73個變數資料集建立預測早期妊娠糖尿病的模型。該研究結果發表在Journal of Clinical Endocrinology & Metabolism上。
研究者發現,使用73個變數的深度神經網路模型具有較高的鑑別能力,其曲線下面積(AUC)為0.8。使用7個變數的logistic迴歸模型也獲得了有效判別能力,其AUC為0.77。
與BMI 17~18 kg/m2(最小風險區間)相比,較低的BMI(≤17 kg/m2)與妊娠糖尿病風險增加相關,雖然未達統計學意義(11.8% vs. 8.7%,P=0.0935)。
模型顯示,總甲狀腺素(T4)和總三碘甲狀腺原氨酸(T3)在預測妊娠糖尿病方面優於遊離T4和遊離T3。此外,脂蛋白(a)具有良好的預測價值,其AUC為0.66。
研究者寫道,使用基於機器學習的變數選擇方法,選擇出了17個重要的妊娠糖尿病預測變數。這17個變數值得在妊娠糖尿病領域進行深入研究,特別是脂蛋白(a)可能與妊娠糖尿病密切相關。為了更實際的臨床應用,他們開發了一個7變數線性迴歸模型。研究者指出,未來還需進一步開展研究以明確總T4、遊離T4與妊娠糖尿病之間的關係,以及中國女性BMI過低與妊娠糖尿病之間的關係。
Huang表示,預測模型的效用還需要透過前瞻性研究來驗證。現在他們正在進行一項基於這種預測模型的多中心隨機對照研究,主要探討營養干預能否降低高危孕婦妊娠糖尿病的發生率。
參考文獻:Wu YT, et al. Early prediction of gestational diabetes mellitus in the Chinese population via advanced machine learning. J Clin Endocrinol Metab. 2020 Dec 22:dgaa899. doi: 10.1210/clinem/dgaa899.