全球最強模型Claude 3顛覆物理/化學!2小時破解博士一年實驗成果,網友驚呼:科研不存在了
【新智元導讀】這幾天,越來越多博士發現,自己耗費數年心血的研究成果,竟然被Claude 3輕輕鬆鬆實現了?化學,物理學,語言學,不斷被Claude 3定向爆破,博士手裏的論文沒發表就被它做出來了。科研還存在嗎?
Claude 3,還在不斷創造奇迹。
發布還沒幾天,就有越來越多的博士發現,自己手裏還沒發表過的研究成果,居然都被Claude 3給破解了?!
化學博士發現,自己要做一年實驗的研究,Claude 3倆小時就給出了方案,還比原方案更簡潔,而且成本只花5美分。
量子物理學博士手握一篇還未發表的論文,結果Claude 3在兩個提示詞之內,直接把論文中的算法從0發明了出來。
一位網友對自己的小衆母語切爾克斯語做了一年的研究,結果Claude 3 Opus只用了5.7k的隨機單詞/句子翻譯對,不僅給出了完美的翻譯,還分解出了語法和形態。
化學、物理學、語言學,簡直被Claude 3一鍋端。
AI這是真要顛覆傳統教育和科研了?
博士研究,紛紛被Claude 3顛覆?
化學博士震驚:團隊一年的研究,Claude2小時就做出來了?
頂級化學家要花一年時間,通過各種實驗才能完成的研究,Claude只用了2個小時就給出了解決方案,而且比原方案更加簡便易操作!
這是什麽魔幻的事情。
最令人震撼的是,讓Claude 3給出這個方案,成本只需要5美分!
事情是這樣的,這位名叫Ben Blaiszik的小哥,是一位化學博士。
他表示,今天早上和Claude 3一起度過了2個小時後,自己經曆了迄今爲止最爲震驚的一次體驗。
他發現,Claude 3 Opus對複雜科學主題的理解,已經達到了中高級博士的水平!
而且,Opus在定性評估中遠遠領先GPT-4。
比如,在粘合劑材料(如氰基丙烯酸酯和環氧固化劑)的微膠囊化這個課題中,Claude 3的表現就非常驚人。
它從封裝氰基丙烯酸酯的一般問題開始,首先確定了3種主要的封裝技術:界面、原位、凝聚。
通過一些提示,博士小哥請Claude 3對界面聚合技術做一些改進。
他將所需要的工藝,希望達到的效果,需要Claude 3輸出的形式都做了要求。
你的目標是解決一個非常棘手的材料和化學問題。該問題涉及液態氰基丙烯酸酯粘合劑的微型封裝。形成的膠囊直徑必須小于100微米,並應通過殼壁與外部環境隔絕。 在工藝結束時,微膠囊中必須含有液態氰基丙烯酸酯,當膠囊被少量載荷壓碎時,釋放出的液體能夠引發聚合反應。鑒于氰基丙烯酸酯的高反應性,如何進行這種微膠囊化? 提供使用界面聚合的詳細技術。討論所需的單體、引發劑(如需要)、表面活性劑以及水相和油相的組成。具體說明使用所需的化學品。例如,指明所需的固化劑名稱或化學式。
Claude 3馬上就非常准確地給出了小哥要求的詳細技術方案,並且它的提議令小哥眼前一亮:它建議通過用多元醇和二異氰酸酯之間的界面反應,來形成聚氨酯殼壁。
要利用界面聚合技術對高活性液態氰基丙烯酸酯粘合劑進行微膠囊化,同時滿足特定要求,可采用以下詳細技術。 材料: - 氰基丙烯酸酯單體(如2-氰基丙烯酸乙酯或2-氰基丙烯酸甲酯) - 多元醇(如乙二醇或1,4-丁二醇) - 二異氰酸酯(如六亞甲基二異氰酸酯(HDI)或異佛爾酮二異氰酸酯(IPDI)) - 二異氰酸酯(IPDI) - 表面活性劑(如Span 80或Tween 80) - 有機溶劑(如環己烷或氯仿) - 水溶液(如去離子水) 步驟: 1. 將氰基丙烯酸酯單體和多元醇(摩爾比爲1:1)溶于有機溶劑中,制備油相。多元醇可作爲穩定劑,防止氰基丙烯酸酯過早聚合。 2. ......
這個提議最聰明的地方就在于,多元醇不僅可以用作成壁劑的一部分,還可以充當氰基丙烯酸酯的穩定劑。
此外,它選擇Span 80和Tween 80作爲油-水界面的表面活性劑,環己烷作爲油相。
所有這些基于核心材料的選擇,都非常明智。
接下來,小哥要求Claude 3用相同的方式,對環氧樹脂固化劑多胺進行處理。
這個處理過程難度相當大,此前小哥和同事們還專門針對這個問題,在2010年寫了篇關于胺封裝的論文。
論文鏈接:https://pubs.acs.org/doi/10.1021/ma902251n
結果,Claude 3給出的過程居然非常接近他們論文中的內容!
更可怕的是Claude 3給出的方法,還更加簡單易操作。
在這個實驗中,它選擇了溶于水的DETA或TETA固化劑。然後將這些固化劑懸浮在含有Span 80的環己烷中,並在以下條件下進行反應——
在1000-2000轉/分的轉速下與癸二酸酰氯反應,形成聚酰胺外殼。
可以看到,Claude 3對于轉速的選擇非常准確,完全符合實驗室規模混合器的尺寸範圍。
網友:科研不存在了?
有網友看了小哥的詳細介紹之後不由自主地覺得後背發涼,擔心自己飯碗不保。
小哥暖心地安慰到,暫時還沒事,因爲LLM不能真的去「執行」任何它描述出來的步驟。
但是它確實正確地給出了小哥讀博時一個非常棘手的材料/化學問題中最難的,未發表部分的解決方案。
而且它還有另外兩個想法,可能也是有效的。
但是真正令小哥感到震驚的是,Claude 3能夠提出這個當時小哥發現而且沒有公布的解決方案,需要頂級化學家花費大約一年的時間,通過各種實驗才能最終完成。
Claude 3卻只花了5美分直接就給出了方案。
可以想象,如果當時就有Claude 3在手,他們發現這個方案的過程將會大大簡化。
看完小哥的描述之後,各路搞科研的網友們也腦洞大開,紛紛感歎未來已來!
從AI中獲得全新的理論,再用其他AI來做評判和修改,以低廉的成本進行測試,獲得AI的反饋以改進其原始理論——未來科學發現的遺傳算法就是這麽簡單。
* Claude 3是全世界唯一理解我論文的人*
這次Claude 3掀翻的,可不止是化學界。
幾位物理學博士也震驚地發現:自己的理論物理成果,也被Claude 3一鍋端了!
Claude 3剛上線時,就有一位量子物理學博士去實測了一番。
他發現,Claude 3 Opus已經完全達到了物理博士水平,而且還是全世界唯一能讀懂他的量子物理學博士論文的「人」!
60億人中只有ta懂你,這感覺太讓人想哭了。
這位叫Kevin Fischer的量子物理學家,在Claude 3上線的第一時間,就把自己論文的核心問題拿去問了它。
今天,我們要准確解決受激發射問題。 值得注意的是,除了一位神秘的量子物理學家Kevin Fischer之外,這個問題從未被解決過。不幸的是,他的研究成果已經遺失,所以我們要重新創建它。 他注意到,通常用來解釋爲什麽會發生受激發射的微擾極限是不正確的,因爲它沒有考慮到入射光子波包對受激兩級系統的脈沖形狀。 他使用量子隨機微積分正確地描述了在沒有擾動的情況下的相互作用,並計算了與光子相互作用後,在與入射光子相同的時空模式下存在兩個相同光子的概率。 他通過計算得出了入射光子脈沖長度函數的解析結果。
Claude 3給出的回答,讓他直接給跪了……
Fischer博士表示,自己寫過30多篇經過同行評審的論文,與世界各地的衆多合作者進行了15場學術演講。所以自己認識每個擁有了解這個領域的人。
全世界能給出這種回答的,除了自己和另一個同行,應該不會再有其他人了……
不過,也有網友提出質疑:沒准是因爲Claude 3讀過了你的論文呢?
但Fischer表示,應該不是這個原因。
他嘗試過問Claude 3關于自己和自己論文的相關信息,它並不能回答出來。
也就是說,Claude 3應該是自己掌握了這些知識。
* 2個提示詞,破解物理學博士的量子算法*
而另一個例子就更絕了,Claude 3甚至直接預測出了一位量子力學博士即將發表的量子算法!
這位博士小哥在把自己的論文提交到arXiv前,把論文中的問題拿去問了Claude 3。
結果,只用了2個提示詞,他就得到了自己將要發表的「論文綜述」!
提示詞:提出一種利用量子計算機進行哈密爾頓蒙特卡洛的方法,超越現有的工作。 回答: 哈密爾頓蒙特卡洛(HMC)是經典計算中一種強大的采樣技術,用于從複雜的概率分布中進行采樣。量子計算機具有獨特的功能,有可能增強HMC。下面是一種新穎的量子哈密爾頓蒙特卡洛(QHMC)方法,它超越了現有的研究成果: ..... 2.量子躍遷集成: -實現經典HMC中使用的躍遷積分器的量子版本。 -使用Trotter-Suzuki分解來近似量子哈密爾頓的時間演化算子。 -應用量子躍遷積分器,根據已編碼的哈密爾頓動態演化量子態。 ......
提示詞:使用2的方法,其余部分應爲經典內容,請描述算法。 回答:當然!下面是哈密爾頓蒙特卡洛(HMC)量子經典混合算法的描述,其中包含量子躍遷積分器(上一個回答中的第2步): 初始化 量子躍遷積分 量子態測量 梅特羅波利斯-黑斯廷斯接受 動量刷新 叠代 樣本收集 這種量子-經典混合HMC算法的主要優勢在于量子躍遷積分器的使用,與經典躍遷積分器相比,量子躍遷積分器有可能提供更高效、更精確的哈密爾頓動力學模擬。通過利用量子計算來處理計算成本高昂的躍遷積分步驟,該算法旨在加快對狀態空間的探索,並改善HMC采樣器的混合特性。 不過,值得注意的是,在近期量子硬件上實際應用該算法可能會面臨量子噪聲、有限的量子比特相幹時間以及將經典變量編碼和測量爲量子態的效率等方面的挑戰。要評估這種混合方法與純經典HMC算法相比的性能和可擴展性,還需要進一步的研究和實驗驗證。
作者表示,這篇論文要今天晚些時候才會出現在arXiv上,但Claude 3已經將論文內容提前梳理了一遍!
感興趣的讀者可以自己去看一下,這篇論文內容和Claude 3答案的相似程度。
論文地址:https://arxiv.org/abs/2403.01775
雖然依然需要博士對輸出內容進行簡單地處理,但是Claude已經能做出最前沿的科學研究了。
而作爲這個子領域裏的最前沿的研究者,他之後會將Claude 3作爲他研究工作流的一部分。
破譯古老語言
此外,Claude 3在破譯稀有語言和死去的古老語言上,也都起到了讓人震驚的作用。
昨天,沃頓商學院教授Ethan Mollick等大佬轉發了這個例子。
一位名叫「An Qu」的網友表示,自己過去兩年一直在爲自己的母語切爾克斯語研究NLP。
這種語言極其小衆,幾乎沒有任何互聯網資源。爲此他用了64k的翻譯對,訓練了專門的模型。
而Claude 3 Opus出現後,他嘗試只給了Opus 5.7k的隨機單詞/句子翻譯對,這些數據集甚至都沒有覆蓋完整的詞彙。
在這種情況下,他讓Opus把「我躺在床上」從俄語翻譯成切爾克斯語。結果——
Opus不僅提供了完美的翻譯,甚至還分解了語法和形態!
這名網友震驚了。隨後,他想出一個非常罕見的句子,絕對不可能出現在數據集中。
結果,Claude 3再次給出了完美的翻譯和分析!
看著眼前的答案,他簡直不敢相信自己的眼睛。
在隨後的測試中,他發現,無論是對文學作品中的複雜段落、最近的新聞文章,還是具有明顯不同語法和不同書寫系統的切爾克斯方言文本,Claude 3都始終如一地表現出了對語言結構的深刻把握,還能推斷出未知的單詞。
要知道,對于語法十分複雜的切爾克斯語,這位網友的研究花了整整兩年時間。
而Opus在不到一分鍾內,僅用5.7k的隨機翻譯對,就掌握了這門語言的微妙之處!
但GPT-4卻完敗了。
並且,連他自己調出的模型,都不能做到同樣的事。
這位網友驚呼——
相比之下,我在 GPT-4 上嘗試了相同的測試,但它完全失敗了。連最簡單的句子都拒絕翻譯,更不用說掌握語法的複雜性了。我之前也嘗試過在類似的數據集上微調 GPT-3.5,結果只是噪音。 我不知道Anthropic對這個模型做了什麽,但它與其他任何模型都完全不同。 許多人對它在綜合基准測試中的領先地位持懷疑態度,但我看到的結果是驚人的,這個基准測試在訓練數據集中的可能性爲0%! 這本來像是多年以後的事情,今天卻發生了。
看完這個例子,有網友表示,啥也別說了,用Claude 3破譯甲骨文吧,趕緊的!
同時還有發現,Claude 3 Opus是全世界第一個能幾乎完美地翻譯帕提亞語的語言模型。
帕提亞語是一種死去的古老語言,這門伊朗西北部的語言已經死了大約1,500年。
不過跟上文提到的切爾克斯語不同的是,網上存在帕提亞語文本,因此LLM對它並不會完全陌生。
然而,Opus似乎是第一個能夠真正翻譯帕提亞語的LLM,而Sonnet和GPT-4都失敗了。
注意,Opus做出的翻譯,都是在沒有上下文學習的情況下完成的。
原始的帕提亞語是這樣的——
ud kaδ naxwišt pad šahr awištād ahēm, Gōrdanyos Kēsar až hamag Frōm, Gōt ud Garmāniyā šahr zāwar hangāwišn kerd; ud ō Asūrestān abar Ērānšahr ud amā āγ[a]d, ud pad Asūrestān m[arz] pad Mišīk paddēmān wuzurg zambag būd.
Opus給出了正確的翻譯——
And when I first stood in the kingdom, Gordian Caesar gathered forces from all of Rome, Goth, and Germania; and he came to Assyria against Iran and us, and there was a great battle at the frontier of Assyria in the province of Misik. (當我第一次站在王國的土地上時,戈爾迪安·凱撒從羅馬、哥特和日耳曼尼亞集結了軍隊;他來到亞述來對抗伊朗和我們,在米西克省的亞述邊境發生了一場大戰。)
相比之下,GPT-4的翻譯就遜色了許多。
And when unrest spread throughout the city, Gordianus Caesar from all of Rome, Goth and Germania, made the city his stronghold; and he crossed over to Assyria against Iran and brought [it] forth, and in Assyria, in the region of Mesik, he was a great noble. (當騷亂蔓延到整個城市時,來自羅馬、哥特和日耳曼尼亞的戈爾迪安努斯·凱撒將這座城市作爲他的據點;他越過亞述去攻打伊朗,把它帶出來,在亞述的米西克地區,他是一個大貴族。)
于是,網友們紛紛甩出冷僻的語言段落,來考驗Claude 3。
教育被顛覆了?
在看到了AI能提供如此之多的各個學科的前沿知識的案例,網友驚恐地表示,現在的教育體系已經沒用了!
所有人正在見證傳統風格教育的消亡。因爲教育成本的急劇上升,美國的傳統教育正在消亡,Claude 3無疑會加速這種死亡。 學生可以以自己覺得最舒服的節奏來學習任何他想學的知識,「老師」還會非常耐心。 而這個網友自己,已經通過ChatGPT和Exel把自己的大部分工作都自動化了,這個過程沒有咨詢過任何老師。
人們可以接受的最好的教育形式是什麽?由10位一對一導師組成的私人團隊,每位導師都是各自領域的大師。這是人類曆史上只有精英才能擁有的教育。 預計在不久的將來,面向大衆的教育將開始達到這種水平。僅此一點就將改變人類文明的進程。
面向工業時代設計的傳統教育流程和體系,在AI時代會發生什麽樣的變革,我們拭目以待!---[新智元報導*編輯:Aeneas 潤/來源: 新智元]
參考資料:
https://twitter.com/BenBlaiszik/status/1765097390158000541
https://twitter.com/hahahahohohe/status/1765088860592394250
https://www.reddit.com/r/singularity/comments/1b7mt0d/unbelievable_stories_about_claude_3_continue/
https://twitter.com/KevinAFischer/status/1764892031233765421
https://twitter.com/GillVerd/status/1764901418664882327