OpenAI向左,Meta往右
OpenAI正變得越來越封閉,但它的對手Meta(前Facebook),卻通過開源贏得不少贊譽。
1月18日,馬克·扎克伯格宣布,Meta正在計劃構建自己的AGI(通用人工智能),將在絕大多數領域中都達到或超越人類智能水平。同時他強調,保證會向大衆開放這一技術,以便人人都能從中獲益。
與OpenAI拒絕Open他們的算法、路線、論文相反,Meta選擇Open到底。此前震驚業內的大模型LLaMA,大獲好評的LLaMA 2,以及正在研發的LLaMA 3,都是開源的。它們成爲很多AI公司研究、學習甚至抄襲的對象。
通過開源這一手段,Meta在某種程度上打破了大模型的壟斷,成爲OpenAI和谷歌雙雄相爭之外的第三股力量。一些人將扎克伯格視爲大模型時代的英雄,有人在扎克伯格的帖子下留言,建議Meta更名爲OpenAI,OpenAI更名爲CloseAI。
事實上,Meta過去開源了它研發的幾乎所有基礎設施,比如用于Web和APP開發框架的React,以及機器學習框架PyTorch,而ChatGPT就是基于PyTorch開發的,OpenAI也運行在PyTorch上。按照Meta首席科學家楊立昆的話說,除谷歌外,全世界都運行在PyTorch上,因爲谷歌有自己的系統。
只是,這些東西在過去都被Meta的負面新聞掩蓋了——干預選舉進程、提供虛假信息、危害青少年健康,在矽谷,罵Facebook曾是一種“政治正確”, 人們認爲這是一家價值觀敗壞的公司。
如今風評大變,Meta一時彷彿成了整個AI圈的希望,它的股價在2023年上漲了160%,在美國前五大科技巨頭中漲幅僅次于英偉達,最近重返萬億美元市值,股價創新高。而曾以挑戰者姿態崛起的OpenAI,前不久剛經歷了一場宮鬥,散發出越來越濃的銅臭味。
OpenAI向左,Meta往右,兩家原本沒有太多交集的公司,正走出截然不同的路。
OpenAI,走向封閉
在討論這兩家公司的境況之前,我們先把時間拉回到十年前。
2013年,有一家叫DeepMind的AI公司,同時引起了谷歌和Facebook(當時還沒更名爲Meta)的注意。
當時這家公司剛嶄露頭角,嗅覺敏銳的谷歌和Facebook都想收購它。最終,谷歌在競購中勝出,2014年1月將DeepMind收入囊中。三年後,DeepMind開發的AI機器人AlphaGo,以4:1擊敗了韓國圍棋冠軍李世石,一舉成名。
谷歌收購DeepMind時,有兩個人心裏很不是滋味。一個是扎克伯格,他當時已經意識到AI的巨大前景;另一個是馬斯克,他不想AI被谷歌這樣的大公司控制。
于是,扎克伯格決定自己做,他花重金從紐約大學請來了計算機科學領域的權威人物楊立昆,啓動FAIR項目,在Facebook成立了AI實驗室。馬斯克則和奧爾特曼成立了OpenAI,用來對抗谷歌。
從當時的情形來看,扎克伯格是爲了自己的公司,馬斯克是爲了全人類。馬斯克認爲,由大公司控制的少量AI系統很不安全,唯一的辦法是讓盡可能多的人都擁有AI。所以OpenAI一開始就定位開源,是一個非營利性的機構。
馬斯克當時說:“我們希望有一種類似于Linux版本的AI,不受任何個人或公司的控制。”
一個爲私,一個爲公,兩家公司一開始就選了不同的路。
馬斯克提到的Linux,是一款免費開源的操作系統。在互聯網早期,計算機剛開始普及時,可用的操作系統不多,要麽源代碼被軟件廠商嚴格保密,要麽收取很高昂的費用。一個歐洲大學生開發出Linux操作系統的雛形,然後免費對外公開了自己的代碼。
由于開源,全球程序員都加入進來改進代碼,最終創造了Linux操作系統,且使用完全免費。這大大加速了計算機的普及。我們今天熟知的安卓系統,就是基于Linux內核,全球大部分手機都跑在這個系統上。
馬斯克的想法很簡單,AI時代也需要有這樣一個開源開放的操作系統,市場不能讓巨頭獨占。
OpenAI的啓動資金來源于一批科技大佬捐贈,它一開始的確是按開源的路徑走的,2019年發布的GPT-2,就是一個開源大模型,當年還有人用GPT-2爲《權利的遊戲》改寫劇本結尾。
但也是在GPT-2發布之後,OpenAI逐漸走向封閉。它隨後成立營利性子公司,接受了微軟的數十億美元投資。
在那之後,2020年發布的GPT-3,2022年升級的GPT-3.5,以及2023年3月發布的GPT-4,都是閉源模型,一開始OpenAI還公布論文,到後來連模型具體參數都不再公布。
而從整個大模型行業的競爭格局來看,“OpenAI-微軟”“DeepMind-谷歌”的雙巨頭組合格局正式形成。
馬斯克對此非常不滿。他說,OpenAI設立時是一家開源公司,現在變成了一個閉源、受微軟控制的逐利公司。這根本不是他想要的。
這期間Meta沒閑著。除了折騰元宇宙,Meta的AI團隊一直在研究大語言模型,並發布了一些開源項目。大家各做各的,互不干涉。
在OpenAI發布ChatGPT的幾周前,Meta發布了一個類似的聊天機器人Galactica,專門用于撰寫科學論文。誰知道這個産品不僅沒引起轟動,還招來一片罵聲,網友痛斥它會破壞科學出版。以至于Meta的人取消了演示,覺都睡不著。
當時人們關心的是Meta的元宇宙項目是不是快涼了,裁員裁到哪了,沒人關心它的AI做得咋樣。至于OpenAI,大家覺得它代表新勢力,對它更加包容。
按照楊立昆的說法,兩周後ChatGPT問世,被視爲救世主降臨。隨後的很長時間裏,OpenAI都是全球科技界的當紅炸子雞,登上神壇奪走了所有目光。人們津津樂道于,OpenAI是如何沖破谷歌的封鎖,對巨頭形成壓制。
在崇尚個人英雄主義的美國,創業新秀挑戰舊勢力的劇本,向來充滿話題性。于是大模型頭部選手的競爭,變成了OpenAI和谷歌的雙雄爭霸。
但一向好強的扎克伯格不會袖手旁觀。Meta秘密研發的LLaMA大模型,已經箭在弦上。
Meta才是全村的希望?
2023年2月,ChatGPT發布之後3個月,LLaMA的第一個版本開源,一開始這個模型只能用作研究。7月,升級之後的LLaMA 2支持免費商用。Meta把模型訓練數據、訓練方法、數據標注等大量細節都公布了,起始代碼全部開源。
LLaMA 2性能非常突出,超過了所有的開源大模型。有人發現,其最大參數的版本比GPT-3參數量小,但效果更好。
曾經跟著馬斯克從OpenAI跳到特斯拉,後來又被OpenAI挖回去的科學家Andrej Karpathy,將LLaMA 2的發布視爲人工智能和大模型發展過程中的重要一天,因爲這“是任何人都可以拿到模型權重的最強大語言模型。”
一時間,整個AI圈對Meta刮目相看。當一批巨頭公司掀起大模型軍備競賽,試圖通過技術封閉實現市場壟斷時,Meta用LLaMA撕開了一條口子。OpenAI沒做的事,Meta做到了。
英諾天使基金合夥人王晟戲稱楊立昆爲“Klaus LeCun”( 楊立昆英文名爲Yann LeCun,Klaus Fuchs在二戰期間向蘇聯提供了曼哈頓計劃的信息)。王晟開玩笑:“不能只讓美國擁有原子彈。”
王晟發現,ChatGPT出現之後,科技圈對大模型熱情且迷茫。投資人中很多是看熱鬧,“因爲第一看不懂,第二不敢投,第三投不到。一個新的技術範式出現,沒人知道它的能力邊界在哪裏。”
王晟對「定焦」說,LLaMA開源對行業影響很大。“Meta過去這些年積累的大模型技術,本來都是不傳之秘,結果一開源,迅速把很多認知拉平了。”
之前,國內團隊研發大模型,只能從零到一不斷試錯,一旦有個點被卡住了,即便從技術角度來說並不是太難,但靠自己可能也需要花一兩年時間才能解決,需要親自踩很多坑。現在Meta直接把它的經驗和數據拿出來,在思路和方法上給了行業非常重要的指引。
“在這個過程中大家學習了很多。假如沒有LLAMA開源,國內大模型今天的水平可能會差很多,我們會大幅度被人甩下。”王晟說。
這也是爲什麽國內一下子突然湧現出200多個大模型。王小川的百川智能在公司成立僅兩個月就發布了一款大模型,其實就是借鑒了LLaMA。李開復的零一萬物推出的大模型,也是使用LLaMA的開源模型架構。
LLaMA開源對OpenAI最直觀的影響,是有一堆中國公司跳出來“吊打”GPT。在他們的口徑中,已經在多項指標上超過了GPT模型,雖然很多榜單都是刷出來的。
更深層次的影響在于,大模型開源社區的力量快速壯大,全球的程序員都能爲開源做貢獻。他們開發出各種開源數據集,叠代出更多新模型,縮小與閉源大模型的差距。所以谷歌的工程師說,谷歌沒有護城河,OpenAI也沒有。
Meta在科技圈的形象變得高大起來。回顧Meta的發展,其實它一直都有開源的傳統。
早在2016年,Meta團隊就開發並開源了深度學習框架PyTorch,它和谷歌的TensorFlow成爲深度學習領域的兩大主流框架。
跟OpenAI現在才開始秘密推進芯片制造項目不同,Meta在三年前就設計了自研AI推理芯片,並采用了開源架構。
在語言翻譯方面它推出了很多開源模型,兩年前發布的NLLB模型是維基百科的翻譯供應商之一,2023年發布的SeamlessM4T可以翻譯近百種語言,同時它還發布了全球最大的開放多模態翻譯數據集。
有研究人員經過對比認爲,Meta更傾向于信任、問責制以及通過開源實現人工智能的民主化。
反觀OpenAI,它依然在技術上保持領先,但拒絕開放。
“沒人知道OpenAI進展到什麽程度了,包括它正在研發的GPT-5,是不是繼續用的transformer都是未知數。現在大家都跟著GPT-3.5的技術路線在跑,假設它悄悄變換了方向,那大家就掉坑裏了。因爲沒人知道正確路線是什麽。”一位AI公司的創始人說。
同時它試圖阻擋競爭對手,以保持自己的先發優勢。
字節跳動在2023年12月被OpenAI停用賬戶,因爲它在調用OpenAI的API開發自身大語言模型的時候,違反了OpenAI的服務條款。有悖商業倫理的行爲肯定是不對的,但外界由此關注到OpenAI的商業條款,它禁止客戶使用GPT輸出的內容開發任何可能會給OpenAI帶來競爭的AI模型。
值得注意的是,微軟也有類似條款。它們將商業上的競爭優勢看得很重要。
人工智能公司開放傳神(OpenCSG)創始人、CEO陳冉認爲,開源的市場空間遠比閉源大,但未來一定是開源和閉源兩條路同時走,“OpenAI開源不開源其實不重要了。”
開源閉源,誰對誰錯?
究竟是OpenAI被利益蒙蔽了雙眼,還是Meta大公無私要爲全人類做貢獻?
或許,它們在本質上並無不同。OpenAI既沒有那麽自私,Meta也不像網友鼓吹的那樣高尚,區別只在于路線和策略。
若論對整個AI行業的貢獻,OpenAI毫無疑問是最大的。畢竟,這一輪AI浪潮是由ChatGPT掀起的。它點燃了一把火,加速了大模型的普及。事實上,前兩年大模型開源社區基本是圍著GPT-3在轉。
OpenAI不像谷歌、Meta那些巨頭擁有雄厚的資金積累,早年大佬捐贈的資金早花得差不多了,沒錢是做不了研發的,總不能用愛發電。所以OpenAI抱了微軟的大腿,奧爾特曼想盡辦法爲OpenAI賺錢。
陳冉認爲,OpenAI的成功其實是商業模式的成功,本質是投資人看到了巨大的商業價值和盈利模式。開源與閉源之間的競爭方向一定是掙錢模式的創新競爭。
Meta將技術開源,也不是只爲他人做嫁衣。開源是一種策略,能吸引更多開發人員免費幫它叠代技術、修複漏洞,正所謂衆人拾柴火焰高,但最核心的技術還是掌握在Meta手裏,該打擊對手的時候它不會手軟。就像谷歌,它旗下的安卓是開源系統,但國內手機廠商做自己的系統還是會有很多限制。
而在大模型火起來之前,Meta掉進了元宇宙的深坑裏無法自拔,砸錢、虧損、裁員,看不到任何希望。大模型是那根救命稻草,ChatGPT則是照亮前路的那束光。
再往深了看,閉源的OpenAI和開源的Meta,從根本上對AI的價值判斷有分歧。
如果將AI比作未來世界的核武器,OpenAI認爲它很危險,得謹慎,不能濫用。Meta則認爲,核武器不能只掌握在少數幾個玩家手裏,應該開放研究。
關于AI的利弊之辯,是科技圈的一個老話題。馬斯克就相信“AI危險論”,他擔心有一天機器的智力、意識都超過了人類,可能會取代人類,摧毀人類文明。所以他當年牽頭成立OpenAI,只是後來OpenAI沒按他設想的路徑走。
基于“防止AI取代人類”的願景,行業裏又延伸出兩大派別。一派認爲大量獨立的AI系統比由大公司控制的少量AI系統更安全,AI的研究應該開源開放;另一派認爲應該封閉研究,這可以減輕安全風險,防止不法分子濫用獲得的代碼。
OpenAI屬于後者。支持它的人認爲開源策略加大了風險,比如倫敦一家AI公司的CEO就認爲,Meta是最不負責任的人工智能參與者,他問:“我們應該令核武器的設計透明化嗎?”
Meta將開源視爲最優策略,楊立昆就認爲,機器最終會比人類更聰明,人類無法阻止壞人獲取它,AI必須是開源的,只有讓更多人參與其中,最終開發出的系統才會更安全。他認爲馬斯克的AI威脅論就是科幻小說看多了。
楊立昆曾經的合作夥伴,跟他一塊獲得圖靈獎的傑弗裏·辛頓,則持有不同觀點,認爲AI將對人類構成嚴重威脅。他的思想也許對他的學生伊利亞造成了影響。伊利亞是OpenAI的聯合創始人兼首席科學家,幾乎決定了OpenAI的技術路線,他也是OpenAI宮鬥事件中開除奧爾特曼的關鍵人物。伊利亞一直致力于追求安全可靠的AGI。業內普遍認爲,商業化和AGI的路線之爭,引發了那場沖突。
所以,OpenAI和Meta有不同的信念。OpenAI將AGI視爲終極目標,並且相信自己將會第一個實現它;Meta將開放平台視爲最好的路徑,試圖制定開源標准。當然,它們都希望在這個過程裏拿到應得的商業利益。
往長遠看,AI的發展是螺旋式上升的,開源也好,閉源也罷,都將爲其注入動能。究竟誰是真的在爲全人類的未來操心,只有等待時間檢驗了。---來源: 钛媒體-