60年首次!AI發現首批新抗生素,MIT重磅研究登Nature!人類有望對抗超級細菌
【新智元導讀】在AI的幫助下,MIT科學家解鎖了60年以來的第一批用于對抗金黃色葡萄球菌的新抗生素!
整整60年,人類在抗生素研究方面沒有取得任何重要進展。
然而,這一空白被AI打破了!
最近,MIT的科學家們利用AI發現了一種全新的抗生素類別,用于對抗耐藥性金黃色葡萄球菌(MRSA)。
21名研究者共同撰寫了這篇論文,登上了Nature。
論文地址:https://www.nature.com/articles/s41586-023-06887-8
MRSA細菌,又稱耐藥金黃色葡萄球菌,已經困擾了人類多年。感染者輕則皮膚感染,重則感染肺部和血液,甚至危及生命。
根據歐洲疾病預防控制中心(ECDC)的數據,歐盟每年有近150000例MRSA感染,而每年死于抗菌素耐藥性感染的有近35000人。
而發現對抗MRSA全新抗生素的,就是一種可解釋的圖神經網絡。
在數百萬化合物中篩選,研究人員在小鼠中測試了283種有前景的化合物,其中幾種對MRSA有治療效果。
LeCun、Tegmark等AI界的大佬紛紛動手轉發了這一AI的重磅發現。
通過深度學習模型,AI又一次改變了醫學領域的遊戲規則。
有人表示,這更證實了a16z bio+health的創始人的觀點:「AI是來治愈人類的,不是來殺死人類的。」
AI發現新型抗生素,280多種候選
這項發明,是人類對抗抗生素耐藥性的轉折點。
MIT醫學工程與科學教授James Collins表示,通過這項研究,我們可以看到爲了預測哪些分子可以成爲良好的抗生素,AI模型是如何學習的。
「從化學結構的角度來看,我們的工作提供了一個在迄今爲止從未有過的框架,在時間和資源上都很高效,同時具備深刻的洞察力。」
爲了預測全新化合物的活性和毒性,團隊使用的是深度學習模型。
模型使用人工神經網絡自動從數據中學習和表征數據,無需顯式編程。
這種圖神經網絡,越來越多地被用于藥物發現中,來加速識別潛在的候選藥物,預測其特性,並且優化藥物的開發過程。
用于預測抗生素活性和人細胞毒性的深度學習模型的集成
爲了研究耐甲氧西林金黃色葡萄球菌 (MRSA),MIT的研究團隊使用擴展的數據集,訓練了一個廣泛擴展的深度學習模型。
爲了創建訓練數據,團隊評估了大約39000種化合物對MRSA的抗生素活性。
隨後,他們將所得數據和有關化合物化學結構的細節,輸入到模型中。
論文主要作者之一、MIT工學院和哈佛博士後Felix Wong表示,這個過程,仿佛就像在打開一個黑匣子。
「這些模型由模擬神經連接的超大規模數字計算組成,沒有人真正知道引擎蓋下面究竟發生了什麽。」
化學空間的過濾和可視化
爲了完善潛在藥物的選擇,研究人員又引入了3個深度學習模型。他們對這些模型進行了訓練,以評估化合物對三種不同類型人類細胞的毒性。
通過將這些毒性預測與之前確定的抗菌活性相結合,研究人員准確地找到了能夠有效對抗微生物,同時對人體傷害最小的化合物。
利用這套模型,他們篩選出了大約1200萬種市售化合物。最終,這些模型確定了5種不同類別的化合物,根據分子中特定的化學結構進行分類,這些化合物對MRSA具有預測的活性。
隨後,研究人員獲得了其中約280種化合物,並在實驗室環境中對MRSA進行了測試。通過這種方法,他們從同一類化合物中發現了2種最有希望的候選抗生素。
果然,在涉及兩種小鼠模型(一種是MRSA皮膚感染模型,另一種是MRSA全身感染模型)的實驗中,每種化合物都能將MRSA的數量減少10倍以上。
可預測抗生素結構的圖神經網絡
研究人員推斷,可以使用神經網絡模型來學習,與抗生素活性相關的化學子結構,從而預測相關的抗生素結構。
研究人員開發了一個叫做Chemprop的圖神經網絡平台,通過可解釋的、基于子結構的方法,來引導探索化學空間。
可解釋的人工智能
研究人員使用的圖神經網絡,包含了每個分子的原子和鍵中的信息,以現實中的子結構爲依據進行預測。
確定這個基本原理可以爲模型的可解釋性提供保證:符合子結構規律的化合物將得到更高的分數。
利用這種方法,模型可以從大型化學庫中識別潛在的抗生素:從藥物再利用中心(包括約6000個分子)中發現了halicin和abaucin,並從ZINC15庫(約1.07億個分子)中發現了其他抗菌化合物。
通過在測量抗生素活性和人類細胞毒性的大型數據集上進行訓練,極大地擴展了用于抗生素發現的圖神經網絡模型,並且假設可以使用圖搜索算法在化學子結構水平上解釋模型預測(如下圖所示)。
由于抗生素類別通常是在共享子結構的基礎上定義的,因此,子結構識別可以更好地解釋模型預測,有效地探索化學空間,並促進發現新的結構類別。
基于這個訓練有素的Chemprop模型,利用圖的搜索算法,研究人員能夠在單個分子的背景下確定具有預先指定阈值的原子數。
使用蒙特卡洛樹搜索來確定包含至少8個原子並表現出大于0.1的高抗生素預測分數。
如上圖a所示,蒙特卡洛樹搜索包括選擇初始子結構,叠代修剪子結構,以及選擇刪除,當子圖作爲輸入傳遞到Chemprop時,預測得分很高。
過濾和可視化化學空間
研究人員用所有訓練數據集重新訓練了20個Chemprop模型的集成,從而産生了四個預測抗生素活性、HepG2細胞毒性、HSkMC細胞毒性和IMR-90細胞毒性的集成。
使用這些集成來預測12076365種化合物的抗生素活性,和細胞毒性特征,其中包括來自Mcule數據庫的11277225種化合物,還有來自Broad Institute數據庫的799140種化合物(如下圖所示)。
根據預測的抗生素活性和細胞毒性過濾了感興趣的化合物,最初僅保留了Mcule庫中抗生素預測評分大于0.4的3004種化合物,以及從Broad Institute庫中保留了抗生素預測評分大于0.2的7306種化合物。
上圖是抗生素預測得分高和低的化合物(t-SNE圖),顯示了各種化合物的化學相似性或不相似性。
實驗效果
接下來看一下模型發現的化合物是否具有抗生素的效果。
這裏研究了化合物1在局部和全身給藥時,對小鼠治療MRSA的療效。
實驗使用氨基糖苷類和耐四環素的MRSA臨床分離株,在中性粒細胞減少小鼠淺表皮膚感染模型中,測試了局部給藥。
與載體相比,用化合物1處理可將平均細菌載量降低約1.2個對數(如下圖所示),顯示出與complestatin和corbomycin相似的功效。
接著,研究人員使用MRSA的噁唑烷酮(oxazolidinone)耐藥臨床分離株,進一步測試了小鼠中性粒細胞減少性大腿感染模型中,化合物1的全身給藥。
與載體處理相比,用80mg/kg的化合物1處理可顯著降低平均細菌負荷約1.2個log(如下圖所示)。
化合物1在大腿感染模型中的功效表明,化合物1和2,以及其它結構類似的化合物,可以作爲新型候選抗生素進行開發。
AI比人類更快地挖掘數據集
「科學美國人」對研究背後團隊的一篇采訪中,更具體闡述了研究人員對AI在醫學領域中作用的觀點。
問:人工智能在篩選和識別新的抗生素化合物方面比人類有什麽優勢?
一般來說,人工智能和機器可以系統地、非常快速地挖掘結。或任何類型的數據集。
傳統上,科學家大約需要花費12年的時間,才能發現一種新的抗生素。然後,再到發現任何臨床候選藥物,還需要3-6年的時間。
最後,你還需要將它們過渡到I期、II期和III期臨床試驗。
而現在,有了機器,便能夠加速這一進程。
以我和同事的工作爲例,我們現在可以在幾小時內,發現數千,甚至數十萬臨床前候選藥物,而無需等待3-6年。
總的來說,是人工智能幫我們實現了這一點。
問:爲了將這類新的抗生素轉化爲臨床藥物,需要後續采取哪些步驟?
這裏還是一個空白領域。你需要系統的毒性研究,然後是IND研究。
美國食品藥品監督管理局會要求你進行這些研究,以評估這一令人興奮的藥物,是否可以過渡到I期臨床試驗。這是任何臨床試驗的第一階段。
同時,我認爲,這是AI在微生物學和抗生素領域取得一個非常令人興奮的進步,我夢想有一天可以創造出能夠拯救生命的抗生素。
問:這項新研究中確定的化合物,對小鼠體內的MRSA等微生物有有效的殺滅作用,對嗎?
是的,他們在兩種小鼠模型上進行了展示。有趣的是,研究表明這些化合物實際上能夠減少小鼠模型中的感染
作爲利用AI的另一個例子,我們最近在實驗室中挖掘了已經滅絕生物的基因組和蛋白組,能夠確定許多臨床抗生素候選藥物。
問:爲什麽讓人工智能模型「可解釋」,這一點很重要?
我認爲,如果有一天我們將AI視爲一門工程學科,這一點很重要。
在工程學中,你總是能夠拆開構成某種結構的不同部件,你知道每一塊都在做什麽。但在人工智能和深度學習情況下,由于它是一個黑匣子,我們不知道中間過程會發生什麽。
所以,開始挖掘「黑盒」以了解每個步驟中實際發生的事情,這對于我們將AI轉化爲工程學科是關鍵的一步。
正確方向的第一步是使用可解釋的AI,以試圖理解機器實際在做什麽,讓它變得不再是一個黑盒。
---[新智元報導*編輯:編輯部/來源: 新智元]
參考資料:https://www.nature.com/articles/s41586-023-06887-8
https://www.euronews.com/next/2023/12/20/scientists-discover-the-first-new-antibiotics-in-over-60-years-using-ai
https://www.scientificamerican.com/article/new-class-of-antibiotics-discovered-using-ai/