除了高智商,人類還有哪些超能力?
所見所得,都很科學
引言:人類作為地球上的主宰之一,擁有許多獨特的特質,不僅體現在智力上,還表現在身體機能、社會行為、思維模式和創造力等方面。這些特質使我們在生存競爭中脫穎而出,並促使我們創造出豐富多樣的文明。本文將從手部結構、社會行為、思維方式和創造力幾個方面來探討人類除了高智商之外的超能力。
靈活可操控的手部結構
人類的手部結構是其巨大成功的基礎,我們之所以能夠製作和使用各種工具,歸功於手部的巧妙設計。相比其他動物,我們的手指更加靈活、敏捷,手腕和大拇指的活動範圍也更廣,使我們能夠進行精細的操控和工作。
我們的手部結構不僅使我們能夠基本的抓握物體,更能進行更為複雜的動作。例如,我們可以使用鉗子、扳手等工具來進行精細操作。我們可以使用筷子、叉子等餐具來進食。我們可以使用畫筆、刀具等藝術工具進行創造性的表達。這些都是得益於我們獨特的手部結構。
我們的手部結構還使我們成為一種高效的工具使用者和創新者。我們能夠製作輪子和車輛,改變了我們的出行方式。我們能夠製作機器和設備,提高了生產力。我們能夠製作電腦和智能手機,拓寬了我們的信息獲取渠道。所有這些都離不開我們靈活可操控的手部結構。
高度的社會合作性
與其他物種相比,人類具有更高度的社會合作性和社交行為。我們能夠建立複雜而穩定的社會結構和組織,這是我們在文化、科技和專業化領域取得重大突破的基礎。
我們的合作行為不僅在基本的生存需求中顯現,還表現在更高層次的社會活動中。我們能夠以群體協作的方式進行集體狩獵、資源共享、防禦敵人等行為。我們能夠創造出各種社會制度和組織形式,如家庭、部落、國家等,使我們能夠更好地協調行動、分工合作。
我們創造的語言是人類社會行為的重要工具。語言不僅用於傳達信息,還能表達情感、傳承文化、推動知識發展。語言使我們能夠更加準確地溝通和理解他人的思想和意圖,也是構建複雜社會結構的重要基石。
我們創造的規則和法律則是社會協作的重要約束和規範。通過制定和遵守規則、法律,我們保護個體權益,維護社會秩序,實現公平正義。規則和法律的存在使得我們的社會行為更加有序和穩定。
我們建立的教育和科研系統為知識的傳承和創新提供了堅實的基礎。我們創造性地發展了各種學科和專業,致力於推動對世界的認識和解析。我們培養和傳承的知識,對人類社會的發展起到了重要作用。
獨特的思維方式
人類的思維方式也是其超越其他物種的重要因素。我們具有獨特的思維能力和認知特點,使我們能夠深入理解世界,解決複雜問題,做出明智的決策。
我們具備象徵性思維的能力,能夠使用符號和概念來代表現實的事物。通過語言、符號、圖像等,我們能夠表達出不同的觀點、情感和意義。這種能力為我們進行思維交流和文化傳播提供了基礎。
我們具備抽象思維的能力,能夠從具體事物中提煉出本質特徵,構建理論模型。我們能夠將複雜的現象和問題進行簡化和分類,從而更好地理解和解決。我們的科學研究和哲學思考離不開抽象思維的運用。
我們具備推理思維的能力,能夠從已知事實推導出未知的結論。通過邏輯推理和推斷,我們能夠根據已有的知識和信息推斷未來的發展趨勢和結果。這種能力為科學研究和問題解決提供了有力的支持。
我們具備反思和自我意識的能力,能夠對自己的行為和情緒進行觀察和評估。這種能力使我們能夠回顧過去的經驗,從中總結教訓和提取有益信息,為未來的行動和決策提供參考。
無與倫比的創造力
人類的創造力是其最為獨特和重要的超能力之一。我們具備豐富的想象力和創造力,能夠創造出獨一無二的藝術作品、創新的科技產品和未來的獨特世界。
我們的藝術創造力體現在各種藝術形式中,如繪畫、音樂、舞蹈、文學等。我們能夠通過藝術作品表達自己的思想和情感,創造出美的享受和藝術價值。
我們的科技創造力體現在各種科技產品的研發和應用中。我們能夠不斷創新,開發出智能手機、互聯網、人工智能等現代科技產品,改變了我們的生活方式和工作方式。
我們的創造力也體現在精神文明的創造中。我們創造了各種神話和故事,傳承着豐富的文化遺產。我們創造了各種哲學和宗教體系,探索着人類存在的意義和價值。我們創造了各種科學和思想體系,推動着人類認知的不斷進步。
總結
人類擁有高智商之外的超能力,體現在手部結構、社會行為、思維模式和創造力等方面。我們的手部結構使我們能夠進行精細操作和工作,成為工具製造和使用的專家。我們的社會合作性使我們能夠建立複雜而穩定的社會結構和組織,推動文化、科技和專業化的發展。我們的思維方式使我們能夠深入理解世界,解決複雜問題,做出明智的決策。我們的創造力使我們能夠創造出豐富多彩的藝術作品、科技成果和精神文明。我們應該珍視和發揚這些特質,以人類的智慧和力量,共同創造一個更美好的未來。-護膚百科聊潛能-
*科學家提出計算生物新方法,有望縮短藥物研發周期*
「這三篇論文雖然分別提出了計算生物學領域的三個不同的方法,也有不同的應用,但基本想法是相同的,暨底層預訓練大模型加上層的強化學習。」對於課題組最近的三篇論文,沙特阿卜杜拉國王科技大學(KAUST)終身正教授、博士生導師高欣表示。
「這種邏輯與 ChatGPT 很類似,但同時又在技術上優於後者。在 ChatGPT 中,GPT 是底層預訓練大模型,用來學習數據本身的分布,而 Chat 是上層的強化學習,用來給底層生成模型的生成進行反饋。而 KAUST 與呈元科技聯合實驗室開發的強化學習算法,因為要同時關注多個指標,所以是多指標同時優化的強化學習,而不是 ChatGPT 這種單指標優化的強化學習。因此,從這個角度來說,我們的工作在一兩年前啟動的時候,其理念就已經非常先進,甚至於比 2023 年年初才風靡的 ChatGPT 還要領先。」高欣說。
近年來,高欣一直在計算機科學與生物學的交叉領域深耕,促成了 AI+ 生物科技產學研協作平台的建立,依託該平台發表了上述三篇同系列的論文,以下為讀者一一介紹。
01.開發深度學習模型,預測新冠病毒變種進化
新冠病毒是人類進入信息時代以來第一次真正意義上的「大流行」,它的演化處於持續不斷的狀態,從最初的野生型,到 Alpha、Beta、Delta、Omicron,再到最近的 XBB 家族,每一次新變種的產生,都會在人類中引發一股新的感染高峰。
如果我們能像預測天氣一樣,預測未來可能會出現的新的病毒變種,那就可以通過提前設計並普及疫苗的方式做好防護準備。
不過,進化通常是具有隨機性的,生物體的「黑盒」性質和個體差異更是讓此過程難以追根溯源。在新冠病毒大流行初期,人類就研發了多種疫苗。與此同時,為了應對這些壓力,病毒也會朝着「免疫逃逸」的方向進化。這主要是因為,新冠病毒已經經歷了多輪篩選,比如疫苗誘導和自然感染後人體產生的抗體等,只有能逃脫「抗體」的病毒,才有可能成為新的流行株。
基於此,高欣團隊提出了全新的研究範式,即在給定現有病毒的基礎上,確定「免疫逃逸」的方向,並沿着這個方向尋找病毒變種。而在這種條件下找到的變種,極有可能就是未來的流行株。
利用深度神經網絡並結合實驗數據,他們確定了「免疫逃逸」的方向;同時,用「遺傳算法」模擬病毒在生物體中的進化過程,找到了可能會在未來爆發的、存在威脅的病毒變種。
具體來說,該團隊通過元學習開發了 ESM 模型,並結合 AlphaFold2、圖模型和生物實驗室的數據對其進行了微調,使其能更好地預測新冠病毒的免疫逃逸能力。這是也模型的前半部分,建立在蛋白質預訓練大模型的基礎之上。
模型的另一部分,則是一種名為遺傳算法的特殊的搜索算法。高欣指出:「這種算法和自然界病毒的演化方式非常相似,和生成式 AI 關係不大。生成式 AI 本身太不可控,任何將其與病毒聯繫起來的想法都是相當危險的。」
據了解,基於該團隊開發的模型,他們在 BA.4/BA.5 以及 XBB1.5 出現之前,就已經預測到了這些變種。
2023 年 6 月 13 日,相關論文以《利用深度學習預測新冠病毒的抗原進化》(Predicting the antigenic evolution of SARS-COV-2 with deep learning)為題在 Nature Communications 上發表[1]。
圖丨相關論文(來源:Nature Communications)
阿卜杜拉國王科技大學 Wenkai Han、Ningning Chen 和 Xinzhou Xu 為共同一作,高欣教授、香港中文大學助理教授 Peter Pak-Hang Cheung 以及中科院計算技術研究所孫世偉副研究員擔任論文的共同通訊作者。
據高欣介紹,這篇論文的審稿人認為研究非常新穎和可靠,又具有非常高的現實意義,不僅可以用來指導新疫苗的開發,也能夠提高衛生部門對新變種的防護意識。
「事實上,在預印本剛出現的時候,我們的論文就在推特上引發了激烈的討論,有上萬的瀏覽量和數百的轉發。歐美的科學家們和普通民眾都對我們模型的結果深感震撼,並呼籲他們的政府重視新疫苗的開發。」高欣說。
從短期來看,雖然「大流行」在各國已經紛紛宣告落幕,但病毒本身尚未消失,因此仍需要對其進行關注和監測。從長期來看,該研究範式也可以在其他流行病毒研究中獲得應用,如流感和艾滋病等。因此接下來該團隊將進一步完善研究體系,並將其拓展至其他流行病毒的研究中。
此外,他們還想探索病毒進化和疫苗設計之間的結合,並基於其對病毒未來的變化預測,設計「通用疫苗」。
高欣表示:「這需要涉及到多個實驗室的合作以及工業界相關的合作,是一個很大涉及面很廣的問題,但我相信這一新的研究範式能為人類帶來新的變化,讓我們更好的地學會『與流行病毒戰鬥』。」
02.讓 AI 在製藥領域實現突破,縮短藥物的研發周期
小分子藥物和抗體的開發過程具有諸多相似之處,比如,都需要先找到與目標作用位點有良好結合性能的先導化合物,然後不斷優化各種屬性以達到預期效果。對於小分子藥物來說,這些屬性包括目標親和力、藥物樣性、代謝速度和毒性等。對於抗體而言,這些屬性包括靶點的親和力、特異性、黏附性、代謝性能和免疫原性等。
這個過程既耗時,成本也很高。但如果能夠通過計算方法提高這一步驟的效率,便可大大縮短新藥的研發周期。
一方面,為給抗體藥物研發過程中的多屬性優化提供新的解決方案,高欣團隊開發了新的抗體設計方法 AB-Gen。AB-Gen 的主要目標是設計抗體的 CDRH3 序列,而後者通常是抗體與抗原結合過程中最重要的區域。
他們用從 OAS 數據庫獲取的 CDRH3 序列,訓練了一個 GPT 模型,並通過優化 GPT 模型生成的結果,生成符合多種屬性約束的抗體 CDRH3 序列。
目前,以《AB-Gen:基於生成式預訓練 Transformer 和深度強化學習的抗體庫設計》(AB-Gen:Antibody Library Design with Generative Pre-trained Transformer and Deep Reinforcement Learning)為題的論文,已經在 Genomics, Proteomics and Bioinformatics 期刊上線[2]。
圖丨相關論文(來源:Genomics, Proteomics and Bioinformatics)
阿卜杜拉國王科技大學 Xiaopeng Xu 為該論文的第一作者,呈元科技的兩位研究人員為共同作者,高欣擔任通訊作者。
據了解,該論文的審稿人均為計算生物學領域的專家,對 GPT 和抗體相關的問題非常熟悉。其中一位審稿人表示:「GPT 主要用於分布學習,生成符合訓練數據集分布的序列。而 OpenAI 的 GPT 方法和後來的 RLHF 方法,只能生成符合原有序列分布規律的序列,無法提升序列的屬性。
AB-Gen 方法的最大特點是通過強化學習,讓 GPT 能夠不斷優化所生成序列的屬性,生成滿足目標屬性的序列。這種屬性優化的方法在蛋白質設計相關任務中具有廣闊的應用前景。」
另一方面,為了更好地探索小分子化學空間,尋找具有高結合性能的小分子藥物,高欣團隊結合預訓練大模型 GPT 和強化學習,提出了 SGPT-RL。他們將每個小分子表示為一個序列 SMILES,並通過優化 GPT 的輸出結果,找到與目標有高結合性能的小分子。
在實驗過程中,該團隊發現 GPT 具有很好的記憶能力,能夠學習到訓練數據集中小分子的分布規律。
「通過強化學習,GPT 可以有效地找到與目標有高結合能力的小分子,並學習到一些小分子與目標結合的模式。我們認為這些模式特徵對於設計特定目標的小分子藥物可能會有一些啟示。」高欣說。
目前,以《利用生成式預訓練 Transformer 和深度強化學習優化化學空間的結合親和力》(Optimization of binding affinities in chemical space with generative pre-trained transformer and deep reinforcement learning)為題的論文,已經在 F1000 Research 期刊上線 [3]。
阿卜杜拉國王科技大學 Xiaopeng Xu 為該論文的第一作者,呈元科技的三位研究人員為共同作者,高欣擔任通訊作者。
可以看出,上述兩項研究均是用 AI 在製藥領域實現的創新性突破。對此,高欣表示:「目前,基於生成模型進行藥物的從頭設計已經取得了重要進展,有一些藥物已經進入臨床實驗階段。我相信在未來幾年內,將會有更多這類藥物真正進入臨床應用領域。這些藥物的問世將會顯著降低藥物研發的成本,並為一些患者帶來福音。」
同時,AI 在蛋白質和多肽設計領域也將會得到越來越廣泛的應用。高欣相信這一領域將為大分子藥物、多肽藥物、酶以及其他蛋白相關應用提供新的解決方案。他也非常期待基於生成式 AI 技術研發的生物藥能夠進入臨床應用階段。
03.「問題的定義才是重中之重」
高欣表示,上述研究均包含以下步驟:問題定義、數據收集整理、方法設計、模型實現和調試、干實驗測試、濕實驗驗證、實際管線賦能等。
在他看來,第一步和最後一步最為重要,也是其區別於其他大部分純學術研究的關鍵點。
由於許多純學術研究是好奇心驅動的,因此其解決的問題,可能並非產業界最急需解決的痛點。同時,大部分學術論文都會強調技術的先進性和新穎性,這會導致許多科研人員,甚至是領域專家,犯重技術、輕概念的錯誤。
「我會經常告訴團隊,問題的定義才是重中之重,是根本。因為問題的定義一字之差,就會導致問題變成另一個完全不同的問題,而問題的最優解和解法都跟着發生徹底的變化。所以,一定要確保問題是定義準確正確的,而不能盲目地去跳進技術細節而去解決一個錯誤定義的問題。」高欣說。
此外,絕大多數科研界實驗室都不具備管線賦能的能力,但這對數據科學來說卻是必不可少的一個環節。這是因為,實際問題的複雜程度是任何實驗室的環境都不可能覆蓋到的,如果無法走向應用,就可能存在紙上談兵的嫌疑。
科研之外,高欣還以聯合創始人的身份於 2022 年 4 月創立了呈元科技,這是一家基於下一代 AI 生物設計技術的合成肽創新療法公司。
在阿卜杜拉國王科技大學校長陳繁昌(Tony Chan)和創新工場董事長兼 CEO 李開復的共同推動下,高欣實驗室與呈元科技開設了聯合實驗室。前者負責前沿算法設計與開發,後者負責算法的工業級改造及應用、自產數據的提供和濕實驗驗證,兩者形成了嚴格迭代的乾濕閉環。
高欣認為:「任何 AI+Biology 這個交叉領域的突破性進展必須要有這樣一個乾濕閉環,乾濕平等對話的生態,才有可能完成。如果是一方主導,而另一方只是其輔助和服務的角色,那麼永遠都無法在這個交叉領域產生根本性的突破。」
此外,談及研究過程中遇到的難忘往事,高欣認為令他印象最深刻的是,使用 GPT 進行藥物設計時收到的反饋。
他說:「從 2020 年開始,我們就開始嘗試使用基於 GPT 的生成式 AI 來進行小分子設計,當時 GPT 還沒有變得非常流行。到了 2022 年,我們開始投稿時,ChatGPT 還沒有引起廣泛的關注,許多研究者對基於 GPT 的生成式 AI 方案持懷疑態度,這也導致我們的論文在最初投稿過程中遇到了困難,期刊編輯和同行專家們對此提出了質疑。」
但他們依然堅信這個方案在藥物設計領域具有巨大的價值和潛力,並很欣喜地看到其項目啟動並完成超過一年的時間之後,相同的想法在不同的應用領域取得了舉世矚目的關注和轟動,並成為改變世界科技走向的技術理念。
「這充分說明我們最初的判斷和方向是完全正確的,這也是為什麼我們的論文從預印本階段就開始受到了廣泛的關注和討論,相應期刊也對我們進行了快速通道的審稿。」高欣說。
04.聚焦計算機科學與生物學,具備較強的多肽藥物設計能力
據介紹,高欣於 2004 年在清華大學計算機系獲得學士學位,2009 年在加拿大滑鐵盧大學計算機學院獲得博士學位。2009 年 10 月至 2010 年 9 月,在美國卡耐基梅隆大學計算機學院雷恩計算生物學中心擔任雷恩學者。
在擔任阿卜杜拉國王科技大學終身正教授的同時,他也是該校計算生物學中心主任、智慧醫療中心副主任,以及結構和功能生物信息學研究組負責人。此外,自 2021 年 9 月起,他還擔任中國人民大學高瓴人工智能學院訪問講座教授。
如前所述,計算機科學與生物學的交叉領域是高欣所聚焦的研究重點。
在計算機科學領域,他領導的研究團隊主要致力於開發與深度學習、概率圖形模型、內核方法和矩陣分解相關的機器學習理論和方法。在生物信息學領域,他帶領團隊主要致力於構建計算模型、研發機器學習技術、設計高效的算法,以解決從生物序列分析到三維結構確定、到功能注釋、再到了解和控制複雜生物網絡中的分子行為,以及最近的生物醫療和健康領域中的關鍵開放問題。目前,其已經在生物信息及機器學習的頂級期刊和會議上發表論文 340 多篇,引用 8000 余次,H-index 為 48。
目前,高欣聯合創立的呈元科技已經針對天然氨基酸序列、非天然氨基酸序列和複雜構象的多肽,構建了世界上首個跨模態預訓練大模型,其在各種下游任務上,比如親和力預測、穿膜肽預測、穩定性預測等,都表現出了顯著的準確度提升。
高欣表示,該公司的 AI 技術在單個性能指標(如親和力、穿膜性、穩定性等)和多指標同時指導下的多肽藥物設計上,發揮着重要作用。
他進一步解釋道:「我們的 AI 算法絕不是拿來主義,而是通過分析具體需求以及數據的約束、假設、限制及屬性,解決具體問題中的痛點和難點,打造量身定製的解決方案。因此我們的 AI 算法都有創新性和技術壁壘。」
具體來說,生物製藥和合成生物學需要從不同的角度出發,對蛋白進行優化與設計,例如親和力、穩定性、免疫原性等。傳統方法採用層級過濾法,通過前一輪的過濾的候選物,才可以進入下一輪過濾。如果輸入的蛋白空間是所有可能的蛋白,如對 12 個殘基的多肽,搜索空間為 2012,這種層級過濾法可以保證最優性。
不過,由於搜索空間過於龐大,不可能進行遍歷搜索,因此層級過濾法只會對搜索空間的冰山一角進行過濾,最終或者找不到同時滿足所有指標的候選物,或者找到的是次優的候選物。
而該公司的 AI 設計平台在設計多肽藥物時,會對多肽藥物進行全方位的優化,這包括親和力、穿膜效率、穩定性等多個因素同時優化。
同時,他們也提出了基於多指標同時優化強化學習的蛋白質 in silico 定向進化算法。這款算法可以對多個指標同時進行多維度優化,並將多指標作為強化學習的反饋信息指導下一步的搜索。其具體通過模型序列到功能的預測,指導序列的設計生成,生成序列的質量則主要取決於預測模型的性能,因此在單目標預測算法提升後,能夠很輕易地融入原有算法框架,並且會使得序列生成的質量得到提升;更進一步地,多個指標中的任何指標都可以被濕實驗數據所替代,即從而形成各種尺度的乾濕閉環。
如今,該公司新的多肽藥物設計平台和範式已經在多個若干管線中取得良好結果,模型的設計和預測也已得到濕實驗驗證。「預計在公司成立兩年之內,我們會將若干個 First in class(全球新)創新藥管線推進到臨床試驗申報研究(IND Enabling Study)階段。」高欣最後表示。-(DeepTech深科技談生物學)
參考資料:
1. Han, W., Chen, N., Xu, X. et al. Predicting the antigenic evolution of SARS-COV-2 with deep learning. Nature Communications 14, 3478 (2023). https://doi.org/10.1038/s41467-023-39199-6
2. X., Xu, T., Xu, J., Zhou. et al. AB-Gen: Antibody Library Design with Generative Pre-trained Transformer and Deep Reinforcement Learning. Genomics, Proteomics and Bioinformatics; doi: https://doi.org/10.1016/j.gpb.2023.03.004
3. X., Xu, J., Zhou. et al. Optimization of binding affinities in chemical space with generative pre-trained transformer and deep reinforcement learning. F1000 Research; doi: https://doi.org/ 10.12688/f1000research.130936.1.