Nature重磅:終於,科學家打開"AI黑盒",發現了化學新知識
前言 : 今年 3 月,世界氣象組織發布了《2023年全球氣候狀況》報告。
隨後,古特雷斯稱,地球正處於崩潰的邊緣,化石燃料的汙染讓氣候混亂達到了「爆表」的水平。
面對全球自然環境惡化的挑戰,發展可再生清潔能源已成為最重要的解決方案之一。
作為新一代的光伏技術,有機太陽能電池(Organic solar cells,OSCs)憑借質輕、透明、柔性、成本低等優點受到了廣泛關註,在光伏建築一體化、可穿戴柔性電子器件和物聯網設備等領域具有十分廣闊的應用前景。
然而,自 1980 年代以來,提高有機太陽能電池的光穩定性一直是一個難題,這也是阻礙其商業化的重要原因之一。
人工智能(AI)技術有望被用來提高有機太陽能電池的光穩定性。然而,由於 AI 是一個黑盒,其是如何做出決策的,一直無法解釋。
而且,在分子科學前沿,利用 AI 產生對化學知識的基本理解,與 AI 引導的優化策略得出實際結果,兩者同等重要。
為此,來自伊利諾伊大學厄巴納-香檳分校和多倫多大學的研究團隊打開了 AI 黑盒,為提高光伏電池的穩定性做出了進一步的貢獻。
他們將閉環實驗與基於物理的特征選擇和監督學習相結合,提出了一種名為「閉環遷移」(closed-loop transfer,CLT)的新方法,旨在從閉環優化過程中提取和驗證物理洞察,並指導化學發現。
據介紹,CLT 可以幫助研究人員快速識別影響目標函數的關鍵物理特征,從而更好地理解化學現象背後的原理。並且,CLT 可以指導實驗設計,避免不必要的實驗嘗試,從而提高實驗效率。此外,CLT 還幫助研究人員發現新的化學知識,並為材料設計和藥物發現等領域提供新的思路。
相關研究論文以「Closed-loop transfer enables artificial intelligence to yield chemical knowledge」為題,已發表在權威期刊 Nature 上。
論文通訊作者之一 Jackson 教授表示:「AI 工具具有驚人的力量。但是如果你試圖打開引擎蓋了解它們在做什麼,通常你得不到任何有用的信息。AI 可以幫助我們優化一個分子,但它不能告訴我們為什麼那是最佳選擇——哪些是重要的性質、結構和功能。」
研究結果表明,產生的新型光捕獲分子比原來穩定四倍,同時還提供了關於它們為何穩定的至關重要的新見解——這是一個阻礙材料開發的化學問題。通過這一過程,他們確定了是什麼賦予了這些分子更大的光穩定性。他們將 AI 黑箱變成了一個透明的玻璃球。
Burke 教授表示:「模塊化化學方法與閉環實驗完美互補。AI 算法請求具有最大化學習潛力的新數據,自動化分子合成平臺可以非常快速地生成新的所需化合物。然後對這些化合物進行測試,數據返回到模型中,模型變得更加智能——一次又一次。到目前為止,我們主要關註結構。我們的自動化模塊化合成現在已升級到探索功能的領域。」
* 打開 AI 黑盒
AI 黑盒指的是內部工作原理對用戶不可見的 AI 系統。你可以向它們提供輸入並獲得輸出,但是你不能檢查產生輸出的系統代碼或邏輯。
在許多情況下,我們需要警惕黑箱機器學習算法和模型。假設一個 ML 模型對你的健康狀況做出了診斷,我們應該知道模型是如何做出決定的。
而在本研究的領域,了解有哪些決定性因素影響了光穩定性也是非常重要的。科研人員理解分子光穩定性的關註點主要集中在最低激發三重態(T1)的能量學及其與鍵離解能的關系上,而最近的研究表明,對於有限的化學類別,存在更高的能量三重態(Tn,n>1),但仍然缺乏一般性的設計原則。
研究團隊提出的 CLT 方法有望打開 AI 黑盒,超越傳統分析光穩定性的方法,取得突破。為了實現這一願景,在 AI 能夠產生可解釋的假設並增強科研人員對光穩定性和分子功能的基本理解之前,需要從閉環策略中提取知識的新方法。CLT 可以在廣譜的化學空間中優化分子功能,並給出化學知識。
CLT 由三個階段組成:(1)機器學習驅動的假設生成;(2)實驗測試;(3)物理驅動的發現。這三個階段相互疊代,成為閉環,進而發生循環。這種疊代循環對於有效探索化學空間、識別影響分子特征的關鍵決定因素至關重要。
圖|CLT 範式。
第一階段(機器學習驅動的假設生成,綠色軌道)描述了基於 BO 的合成和表征回合,並同步使用基於物理特征的可解釋機器學習。
通過機器學習出現基於物理的假設後,第二階段(假設測試,橙色軌道)實驗性地測試該假設,如果得到驗證,將產生新知識,這些知識在第三階段(物理驅動的發現,紅色軌道)中被用於分子優化。
在這項研究中,團隊通過 CLT 的整個過程,打開了 AI 黑盒。AI 在閉環優化和知識提取方面發揮了關鍵作用。
例如,AI 通過 GRYFFIN 算法進行貝葉斯優化,指導合成和表征過程,以尋找具有更高光穩定性的分子。BO 算法平衡了探索和利用,確保了化學空間的多樣性和高效搜索。
其次,AI 訓練可解釋的 ML 模型,利用基於物理的分子特征來預測光穩定性。這些模型不僅識別了高光穩定性的化合物,還闡明了分子光穩定性的設計規則。
此外,AI 還通過物理建模和特征選擇,發現了高能三重態態密度 (TDOS) 與分子光穩定性之間的強相關性,這為後續的假設驗證提供了基礎。
* AI 驅動科學新發現
總之,閉環實驗,通過使用基於物理特征的可解釋的 ML 模型進行了增強,闡明了有關分子光穩定性的基本化學知識,同時針對高功能分子目標進行了優化。
人機交互、AI 引導的活動產生了本文的假設(30 個分子),其顯著效率得益於 AI 引導的探索和利用的平衡與可解釋的基於物理的建模的結合。
此外,研究團隊也在進一步證明 CLT 廣泛適用於其他前沿應用和研究領域,特別是難以先驗預測的低數據狀態和多維分子特性。有理由相信,CLT 將成為在假設驅動的發現研究中利用 BO 優勢的手冊,並通過基於物理的見解得到加強。
科學研究是一個循環往復的過程,需要研究者不斷地提出假設,進而進行檢驗。在這一連串的探索中,研究者承擔著大量的實驗操作和數據收集任務。在此過程中,AI 是一個不可或缺的助手,它能在多個環節扮演重要角色。
如今,AI for Science 已成為熱議的話題。AI 已在眾多領域展現出其強大實力,涵蓋了生物製藥、新材料研發、前沿物理研究、氣候預測、地球模擬和天文探索等多個領域。特別是在化學領域,AI 的應用更是廣泛。
2018 年 3 月,一項發表在 Nature 雜誌上的研究展示了 AI 在化學合成中的巨大潛力。研究團隊整理了過去幾十年間發表的 1250 多萬個化學反應,並利用深度神經網絡和蒙特卡洛樹算法,成功規劃出新的化學合成路線。這一方法使得設計分子合成路線的時間縮短至僅需 5 秒。
2020 年,麻省理工學院(MIT)在國際頂尖學術期刊《細胞》雜誌刊登了一篇突破性的研究成果,研究人員利用深度學習系統,發現了一種強大的新型抗生素化合物。他們通過計算機深度學習系統建立的模型,可以在幾天內篩選超過 1 億個化合物,從而挑選出不同於現有藥物殺死細菌機製的潛在抗生素。
今年 2 月,來自北卡羅來納州立大學、伊士曼化工公司的研究團隊開發了一種名為 Fast-Cat 的自動化實驗室。
通過結合 AI 和自動化技術,Fast-Cat 實現了催化反應的快速、高效和自動化,不僅可以完全自主連續運行高溫、高壓、氣液反應,還能夠分析每個反應的輸出結果,在沒有人工幹預的情況下確定不同變量對每個實驗結果的影響。它能夠在短短 5 天內提供比傳統方法 6 個月更多的信息,為化學研究和工業生產提供了全新的可能性。
此外,一個名為「RoboChem」的自主化學合成 AI 機器人,不僅在速度和準確性方面都優於人類化學家,同時還顯示出了高度的獨創性。
RoboChem 是一個精確可靠的「AI 化學家」,不僅可以進行全天候的自主工作,快速、不知疲倦地提供實驗結果,還可以迅速優化化學合成過程,進行各種反應,同時產生極少量的廢物,有望大大加快用於製藥和許多其他應用的分子的化學發現。
展望未來,我們有理由相信,隨著 AI 技術的不斷進步,它將為化學乃至整個科學領域帶來更多創新與變革。---[撰文: 馬雪薇/來源: 學術頭條]