Open AI的神秘项目“草莓”,到底是什么?
OpenAI又在搗鼓神秘「黑科技」?
12日,據媒體援引知情人士透露,生成式AI領頭羊OpenAI正開發新的AI大模型項目----"草莓 "(Strawberry),而這個「草莓」非常神秘,很可能與提升AI大模型的推理能力有關。
OpenAI的神秘項目「草莓」是什麽?
據媒體報道,5月份OpenAI的一份內部文件顯示,OpenAI的內部團隊正開發的「草莓」項目,目的是增強OpenAI的模型的推理能力,處理復雜科學和數學問題的能力,讓大模型不僅能生成查詢答案,還能提前規劃,以便自主、可靠地瀏覽互聯網,進行OpenAI 定義的「深度研究」。
按照十幾位人工智能研究人員的說法,這是目前大語言模型還沒能實現的功能。
很明顯OpenAI現階段還不想公布關於「草莓」的詳細資料。
當被問及「草莓」的細節時,OpenAI的一位發言人只是繞了個彎表示:「我們希望AI大模型能像人類那樣看待和理解這個世界。不斷研究新的AI能力是業界的普遍做法,畢竟我們都相信AI的推理能力會隨著時間的推移而不斷提高。」
畢竟即便在 OpenAI 內部,「草莓」的工作原理也是嚴格保密的,目前仍沒有「草莓」的發布時間消息。
但有媒體透露,「草莓」項目的前身是Q*算法模型,Q*能夠解決棘手的科學和數學問題。而數學是生成式AI發展的基礎,如果AI模型掌握了數學能力,將擁有更強的推理能力,甚至與人類智能相媲美。而這一點也是目前的大語言模型還無法做到的。
去年底Q*在OpenAI的內部信中首次曝光,而CEO奧特曼當時被開除也是因為這個Q*項目。
一些OpenAI內部人士指出,Q*可能是 OpenAI 在追尋通用人工智能(AGI)路上的一項突破,其發展速度之快讓人感到震驚,並擔心AI過快發展可能會威脅到人類安全。在這種擔憂蔓延之際,奧特曼在沒有告知董事會的情況下,選擇加速推進GPT系列模型的開發及商業化,這激發了OpenAI董事會的不滿並選擇把他踢出局。
OpenAI的野心:利用「草莓」提高大模型的推理能力
雖然無法獲取「草莓」的詳細情況,但從OpenAI近期的種種蛛絲馬跡中可以發現,增強生成式AI大模型的推理能力,是它接下來的發展重心。
OpenAI的CEO奧特曼曾強調,今後AI發展的關鍵將圍繞推理能力展開。
在本周二的一次內部全員會議上,OpenAI展示了一個研究項目的演示,稱該項目擁有類似人類的推理能力。OpenAI發言人向媒體證實了這次內部會議,但拒絕透露會議細節,因此無法確定演示的項目是否為「草莓」。
但據知情人士透露,「草莓」項目包括一種專門的「後訓練」方法,即生成式AI模型已經過大量數據集上進行預訓練後,進一步調整模型以提高其在特定任務上的表現。這類似於斯坦福大學在2022年開發的「自學推理者」(Self-Taught Reasoner,簡稱STaR)方法。
STaR的創造者之一、斯坦福大學教授Noah Goodman曾表示,STaR可以讓AI模型通過反復創建自己的訓練數據,「引導 」自己進入更高的智能水平,理論上可以用來讓語言模型實現超越人類的智能。
這就和OpenAI想要的「推理能力」對上了號。而且,OpenAI在11日還公布了未來AI發展的五級路線圖:
按照OpenAI的猜想,未來AI會經歷5個階段:
第一級:聊天機器人,具有對話語言的人工智能
第二級:推理者,人類水平的問題解決
第三級:代理者,可以采取行動的系統
第四級:創新者、可協助發明的人工智能
第五級:組織者,可以完成組織工作的人工智能
按照目前搜集的信息,「草莓」項目極可能是幫助OpenAI實現第二級AI的關鍵。
據媒體報道,一位OpenAI高管表示,目前AI模型正處第一級別,但預計很快將達到第二級別,即推理者。OpenAI目前正在致力於在特定任務上實現博士級別的智能,預計可能在一年或一年半內實現。
另一項OpenAI聚焦的功能是,提高大語言模型執行長時間任務(Long-Horizon Tasks,簡稱LHT)的能力,這指的是需要模型提前規劃,並在較長一段時間內執行一系列任務。
據知情人士透露,為了實現這一目標,OpenAI希望「草莓」能成為創建、訓練和評估「深度研究」的模型,並利用「計算機使用代理」(Computer-Using Agent,簡稱CUA)來自主瀏覽網頁,並根據其發現自主采取行動。
如果OpenAI成功了,「草莓」項目很可能會重新定義AI的能力,使其能夠進行重大科學發現、開發新的軟件應用程序,並自主執行復雜任務,那人類離AGI又進一步了。---來源: 華爾街見聞官方-