首頁>科學>

自化學和生物領域資料的差異20世紀80年代以來,來源於化學計量學技術和計算機科學技術的演算法逐步應用並擴充套件到藥劑的合成與分析,如基於結構的藥劑設計(Computer-Aided Drug Design, CADD),常用於解釋藥劑化學結構變化與活性的關係的構效關係;定性/定量機器學習方法(Machine Learning, ML),對水溶性、代謝性、毒性等進行預測,隨著生物資訊學的不斷髮展,其技術也在不斷與藥劑研發中用到的演算法相比較並互相融入,藥學是一個融合化學和生物學的學科,在資料層面,我們首先看一下來自化學和生物領域資料的差異。

化學資訊顯然比生物學資訊可適合進行AI技術計算處理如上所示,當前化學資訊顯然比生物學資訊可適合進行AI技術計算處理,物理化學中熱力學基本原則可以在一定程度上明確配體對受體的親和力,與之相比,在生物學中受體蛋白的構象變化,平衡和偏置訊號就難以定量;當研究涉及到基因表達量或蛋白質修飾的變化時,會變得更加困難,因為建模涉及了對空間變化和時間變化進行模擬,當前一些藥劑發現的輔助細分領域中,我們能夠很好地描述化學資料,並且有大量可用於模型建立的測定資料(如小分子的各種體外物理化學性質和晶型),這些也是當前AI可以發揮作用的地方,但是在真實藥劑的核心研發步驟中,對於小分子藥劑在生物功能中的作用很難用一組有限的引數來定義,使得AI技術在藥劑發現和藥效評估上面臨著更大的不確定性。

簡而言之,藥劑研發中開展AI需要可以定量的變數和有意義的標記,但是在特定的生物靶標體系中,我們常常無法確定哪些是重要的變數,難以透過實驗對其進行定義並獲得資料,也無法在與AI相容的水平上構建體現生物學功能的引數,在此,我們對當前藥劑研發中資料的AI利用進行一些回顧和反思。質量決策比速度和成本更重要(一)藥劑發現中,質量決策比速度和成本更重要考慮到一個專利壽命為20年,假設在臨床一期開始時提交專利申請,為了專案平均能夠覆蓋成本,我們比較了提高化合物的發現速度(每一階段花費時間減少20%)、提高化合物的成藥質量(每一階段故障率減少20%)和降低化合物成本(減少20%)對藥劑發現專案淨利潤的影響(如上圖),可以看出,化合物質量對專案的成功有更深遠的影響,遠遠超出了提高各自階段的提高速度和降低成本,降低由於化合物質量帶來的損失對專案價值的總體影響最大,遠比提高化合物發現及推進速度重要,換句話說,提高化合物的藥劑成功率可減少將藥劑推向市場所需的試驗次數,而失敗次數的減少比更快或較少花費的失敗更為重要。

AI在藥劑發現中的應用有著重要意義這一分析結果對於AI在藥劑發現中的應用有著重要意義,原則上,AI可以實現以上所有目標:可以更快地做出決策(預測要比實驗快)並且可以更便宜地進行決策(預測的成本要低於實驗),並可以做出更好的決策(在合適的資料或模擬允許的情況下,以及如果有事實支援,決策會更好),然而,目前AI技術在藥劑發現中的主要重點似乎是加快速度和節省成本,而不是決策化合物的質量或是對藥效成功的影響,那麼在AI藥劑研發中,應該如何定義化合物質量的成功?為了使AI在藥劑發現專案中顯示其價值,這一關注點可能需要進一步明確,模型構建不應侷限於加快每一階段的速度和節省成本。

(二)當前處於各自孤立機制和靶標中使用的AI發展困境如上圖所示,化合物可以透過調節蛋白質活性來實現它們的效果,但這一過程會受到藥劑代謝、藥劑活性以及非靶點效應等多重因素影響,在目前AI方法面向的藥劑發現中,其主要關注點是化合物對蛋白質的活性,而化合物在體內的其他特性(包括其前體化合物,代謝產物,濃度依賴性效應等)則在模型中被降級為次要的或可忽略部分。由於AI模型從一開始就很少考慮生物學的複雜性,使得這種模型方案在實際應用存在多個問題而降低成功率:(1)僅在單因果疾病的情況下才是合理的,如在病毒感染的情況下,某種蛋白酶是複製或者受體進入細胞所必要的,基於這類單向靶點確實有效並且已經產生了大量的批准藥劑,但是,更多較複雜的疾病難以靠單向靶點調控進行有效修復,導致了許多基於單向靶點藥劑在臨床實驗中失敗,(2)在AI功能中往往會簡化模型而忽視其他問題,如化合物是否到達其預期的靶點,是否能夠治療患病的表型,以及它的副作用是否在可以接受的範圍,(3)AI功能要取得成功,需要建立明確的“化合物-靶點-表型”聯絡,這是在當前生物醫學知識下非常困難的。

17
  • mRNA疫苗可誘導對SARS-CoV-2及其多種擔憂的變體的持久免疫記憶
  • “熱電發電機”,一個能夠將人體散發的熱量轉換成電能的神奇裝置