通訊單位:Princeton University
DOI: https://doi.org/10.1038/s41586-021-03213-y
背景介紹最佳化反應是合成化學的基礎,從最佳化收率到選擇製備候選藥物的條件。同樣,引數最佳化在人工智慧中無處不在,從調整虛擬個人助理到培訓社交媒體和產品推薦系統。貝葉斯最佳化是一種基於迭代響應面的全域性最佳化演算法,在機器學習模型的調整方面表現出了優異的效能。近年來,貝葉斯最佳化方法在化學中也得到了廣泛的應用,但其在合成化學反應最佳化中的應用和評價尚未見報道。
本文亮點1. 本文報告了一個貝葉斯反應最佳化框架和一個開源軟體工具的開發,它使化學家能夠輕鬆地將最先進的最佳化演算法整合到他們的日常實驗室實踐中。
2. 作者收集了一個鈀催化直接芳基化反應的大型基準資料集,對貝葉斯最佳化與人類反應最佳化決策進行了系統研究,並將貝葉斯最佳化應用於兩個實際的最佳化工作。研究結果表明,貝葉斯最佳化在平均最佳化效率和一致性方面都優於人類決策。
3. 總的來說,在日常實驗室實踐中採用貝葉斯最佳化方法,可以透過更好地瞭解、資料驅動的決策來促進功能性化學物質的更有效合成。
圖文解析化學反應的最佳化是一項複雜、多維的挑戰,需要評估各種反應引數,如底物、催化劑、試劑、新增劑、溶劑、濃度、溫度和反應器型別(圖1a)。然而,在實驗室裡,由於時間和材料的限制,實驗室化學家在一個標準的最佳化過程中只能評估這些條件的一小部分。高通量實驗(HTE)的進步擴充套件了實驗能力,在有限的條件下收集幾千個資料點。化學家通常透過查閱化學文獻以尋找類似的反應,並根據經驗、機理理解、經驗資料和簡單的啟發式方法找出最具影響力的維度(即反應引數)來進行實驗(圖1b)。貝葉斯最佳化是一種不確定性引導的響應面方法,用於最佳化計算成本較高的目標函式。貝葉斯最佳化表現出了優異的效能,在許多情況下優於專業從業者和其他最先進的全域性最佳化演算法(圖1c)。
▲圖1 貝葉斯反應最佳化。
最佳化器的發展
為了滿足實驗設計,作者從文獻中收集了反應資料,用於最佳化器的開發和評估(圖2)。我們為Suzuki Miyaura(1)和Buchwald Hartwig反應(2a 2e)選擇了鈀催化的交叉偶聯資料,其目標是在數百或數千個可能反應條件的組合集合中最佳化所需產品的收率。
▲圖2 用於選擇貝葉斯最佳化器引數的資料。
在建立了有效的獲取和處理策略後,作者評估了平衡勘探和開發的各種獲取函式的並行最佳化效能(圖3)。總的來說,作者發現平行預期改善和Thompson抽樣都提供了極好的表現,並且他們的平均結果在統計學上是不可區分的(所有六種反應的p>0.05)。
▲圖3 反應最佳化中的勘探與開發平衡。
在貝葉斯最佳化框架為反應最佳化進行了調整後,作者下一步尋求在一個新的反應空間中統計測試其效能。因為鈀催化的碳氫官能化不需要預官能化起始材料就能產生複雜性分子,在製藥開發中獲得了越來越多的關注。雜環的直接功能化反應是一種特別吸引人的反應,因為它們普遍存在於生物活性化合物中。然而,對於一個給定的雜芳烴底物的功能化往往需要改進反應條件,以達到最佳的反應活性和選擇性。這裡作者研究了咪唑的直接芳基化,以反應3為例(圖4)。作者發現,在反應3的最佳化中,貝葉斯反應最佳化的平均表現優於人類專家。
▲圖4 貝葉斯反應最佳化的統計驗證。
在統計上驗證了該方法後,下一步尋求進行真實的貝葉斯最佳化測試案例,以最佳化與藥物開發相關的反應。在兩個測試反應中,貝葉斯最佳化識別了一系列實驗條件,其引數設定與標準條件有很大不同。此外,最佳化器提供了多種配置,這些配置在大多數維度上都有所不同,但提供了相同的良好結果。
▲圖5 貝葉斯反應最佳化的應用。
原文連結:
https://www.nature.com/articles/s41586-021-03213-y
值得一提的是,早在18年,Doyle和默克公司合作,利用機器學習預測化學反應,該成果發表於Science上。一直以來,Doyle致力於將機器學習應用於化學合成領域,以期望節約化學反應的發現和最佳化所大量消耗的時間、精力與物質資源。
作者簡介Abigail G. Doyle
Abigail G. Doyle普林斯頓大學教授,1980年出生於美國新澤西州普林斯頓。2002年獲得哈佛大學化學與化學生物學博士學位。於2008年7月開始擔任普林斯頓大學化學系助理教授,於2013年被提升為副教授,目前是A. Barton Hepburn化學教授。
Doyle課題組在有機化學,有機金屬化學,物理有機化學和計算化學的介面上進行研究。目標是透過開發催化劑,催化反應和合成方法來解決有機合成中尚未解決的問題。應用機械和計算機輔助技術來分析這些反應,以發現可指導改進催化劑設計和發現新反應的一般原理。
課題組主頁:
https://doyle.princeton.edu/
Ryan P. Adams
Ryan P. Adams,普林斯頓大學計算機科學教授
主頁:
https://www.cs.princeton.edu/~rpa