那些年扎克伯格的錯過與過錯
2013年,在美國內華達州的一個酒店舞廳裏舉辦了一場私人聚會。幾十名工程師、計算機科學家們圍坐在一起,他們正在慶祝一個人工智能組織的成立。
“這是一場天堂裏的婚禮”。說這話的人叫做楊立昆,除了「卷積神經網絡之父」的稱號,在這一年,他做了一個重要的決定,從實驗室走進Facebook,成爲這家科技公司人工智能研究院FAIR的第一代領導者,由此開啓了深度學習的浪潮。
但請注意這是2013年,當時科技行業的大多數人甚至都沒有聽說過深度學習,彼時的Meta(在當時還是Facebook)還是一家社交網絡公司,人們天然地認爲,它的使命不該是探究最前沿的技術,而是快速擴充規模。但紮克伯格沒有這麽做,他下定決心要押注最前沿的技術,比谷歌、微軟等巨頭們更快。
細數扎克伯格和他的Meta,曾一度是AI界僅次于谷歌、微軟的存在。不僅在深度學習浪潮早期就占盡人和,將楊立昆等明星科學家納入麾下,同時也擁有最前瞻性的目光,扎克伯格甚至參與過DeepMind的競購,從微軟裏搶走不少的人才。
十余年過去,在微軟、OpenAI、谷歌等一衆科技巨頭的「AI軍備競賽」中,Meta淪爲了第二梯隊,但扎克伯格並不願意承認這一點。在近期接受The Verge 的訪談中,很久沒有現身的扎克伯格對外宣布了Meta打造通用智能的野心,不僅公布了最新的大模型動態,還大秀算力儲備,借AI之風,Meta股價創歷史新高,市值超過1萬億美元。
只是這一次,扎克伯格的AGI野心真的能實現嗎?
Meta AI 前傳:占盡天時、地利和人和
在AI浪潮中,曾經的Meta是可以和谷歌、微軟掰手腕的存在。
這得益于扎克伯格自身的「野心」,也是「天時」。扎克伯格很早就決定加入谷歌、微軟、蘋果等巨頭的戰爭,即便規模尚小,他渴望通過下一項變革性技術,成爲領導者,因此當谷歌率先通過收購「深度學習之父」辛頓的初創公司進入深度學習領域時,扎克伯格就意識到他也必須抵達那裏。
2013年,當楊立昆決定加入Facebook,成爲人工智能研究院的第一任主任前,這位學者向扎克伯格提了兩個條件:一個是不會離開紐約大學,另一個則是堅持企業研究的「開放哲學」。
扎克伯格同意了這兩個條件,某種程度上也爲Meta在AI時代的領先位置奠定了基礎。
「不會離開紐約大學」讓FAIR始終致力于追趕最前沿的技術,充滿著理想主義。據當時從谷歌跳槽到FAIR的根據實驗室華人成員田淵棟介紹,FAIR實驗室不像谷歌那樣條條框框很多,有各種各樣的限制,相對非常自由,沒有産品壓力。“我到了Facebook之後就好像回到了讀博時的狀態,特別有興奮感,在工作上特別有動力,整個人就好像活過來了。”田淵棟說。
可以說,彼時規模尚小的Facebook並未有谷歌「大象難轉身」的難題,FAIR這種自由包容的研究氛圍可以被視爲是第一重「地利」,同時扎克伯格憑借Facebook牢牢掌握著流量入口,社交網絡上的圖片、視頻、語音等種種多模態的數據,這是深度學習成長的沃土,這是第二重「地利」。
楊立昆所提出的另一個條件——企業研究的「開放哲學」則爲Meta帶來了「人和」。
楊立昆堅信「開放研究」,並以此爲條件,讓這種願景變成了Meta的規範。“因爲如果你的研究秘密進行,你的研究質量會很差,你無法吸引最好的人才,你不會招募到有能力推動最先進技術發展的人。”楊立昆曾這樣說。
在這樣的企業研究哲學下,Meta不走封閉的AI路線,而是盡可能地對外開源研究代碼、數據集和工具。一方面,取得了看得見的研究成果,直接推動了AI的進程,其中最典型的案例有兩個。
一個是自監督和生成模型(Self-supervised learning and generative models)。SSL一直都是Meta布局AI的重要方向。楊立昆曾將SSL視爲「人工智能的暗物質」。他認爲,區別于監督學習這種範式,SSL可以利用大量未標記數據來擴大人工智能規模,這對于識別和理解世界更微妙、更不常見的表示模式很重要。2014年,當Ian Goodfellow提出了GANs模型(生成對抗網絡)時,科技巨頭們先後跳上了研究GANs的彩車,連一向在AI上鮮少發聲的蘋果也在當時發布了一篇「如何更好地利用 GANs」的研究論文。
Meta無疑走在前列,從2015年開始,Meta就關注GANs的不同變體,讓其從研究人員著迷的「玩具」變成可輔助人類生産的「工具」。
Meta的科學家和工程師們認爲,GANs真正有趣的部分是它們對未來的意義,上圖展示了可參與時尚單品的創作圖源:Meta
2017年,Facebook聯合羅格斯大學和查爾斯頓學院藝術史系,針對GANs提出了名爲CAN(創造性對抗網絡),讓AI繪畫真正走入大衆視野。據當時研究人員的測試,請觀衆去判斷由CAN模型生成的AI藝術作品是人類藝術家的作品,還是人工智能的創作。結果,有53%的觀衆認爲藝術作品出自人類,這也是歷史上類似的圖靈測試裏首次突破半數。
另一個案例則是AI框架PyTorch。作爲時下流行的開源深度學習框架,PyTorch被廣泛應用于人工智能和機器學習領域,其地位一度逼近谷歌的TensorFlow。楊立昆曾說:“當初谷歌的TensorFlow確實比Torch更火。然而Meta的PyTorch出現之後,現在其受歡迎程度已經超過TensorFlow了。”
而根據中信建投對Github上的項目數量、關注人數的對比,在AI工程領域,Meta工程領域相關能力僅次于微軟和谷歌。
這種「開放開源」更深遠的影響就是吸引了衆多頂尖人才的加入。深度學習發展的歷史,就是一部科技巨頭的搶人史。彼時的FAIR可以被視爲深度學習「研究與工程」的人才庫。有ResNet網絡的發明人何恺明、VC維和SVM的締造者Vladimir Vapnik、提出隨機梯度下降法理論的Léon Bottou等。
天時、地利、人和,Meta似乎具備成爲AI時代的霸主的因素,那麽究竟爲什麽,Meta和扎克伯格會錯過這次浪潮呢?
FAIR的兩次重組:Meta錯過的時代
2014年,紮克伯格開啓了自己的「亞洲行」,到訪中國時,在清華大學經管學院舜德樓內,用中文演講的扎克伯格闡述了當時十歲的Facebook在「下一個十年」的三個方向:連接整個世界、發展人工智能、虛擬現實。
“第一,我們想要連接整個世界,所以我們要幫助所有人用互聯網,第二,我們想要發展人工智能,第三是所有人用手機以後,我相信下個平台是虛擬現實(virtual reality),Oculus是第一産品,我們希望還有別的很多産品。”
三大方向對應當時Facebook最重要三個業務板塊:連接,即對應來自社交媒體平台所創造的收入。VR,也就是扎克伯格所堅信的「下一代互聯網」,也是後來他口中的「元宇宙」。而人工智能,既是彼時扎克伯格對外展示的野心,也同樣可視爲支撐其他業務的重要技術組件。
扎克伯格曾在說服楊立昆加入時,向這位學者描述過自己的願景——未來,社交網絡上的互動變成獨立完成任務的技術驅動,在短期內,這些技術將識別照片中的人臉,識別語音指令,並在不同的語言之間進行翻譯。從長遠來看,智能體或機器人將巡視Facebook的數字世界,接受指令,並根據需要執行指令。
當楊立昆問Facebook是否有任何不感興趣的人工智能研究領域時,扎克伯格說:“可能是機器人學。”但其他一切——數字領域的一切——都在扎克伯格興趣範圍之內。
按照這樣的戰略邏輯,依靠領先的技術、社交網絡規模化的收入以及VR作爲硬件載體,Facebook理應走出一條更順暢的發展道路。但事實上,誰也難以預料技術的發展與周期變化,扎克伯格與他的Facebook也毫不例外。
理解Meta爲何沒有成爲當下最熱門的AI企業,FAIR的兩次重組是一個很好的觀察窗口。
在2018年之前,FAIR實驗室主要負責學術研究,另一個被稱爲應用機器學習部門(下文簡稱:AML)則是負責産品團隊成果的轉化,雙方互不干涉,相對比較獨立。一個強調最前沿的技術,另一個則是注重轉化,因此如何強調團隊之間的協作,成爲了關鍵。但好在,盡管工作方式不同,但兩個團隊的共識都是一致的,比如強調開放,因此上述問題還並沒有顯露。
轉折的點發生在2018年,FAIR的第一次重組。
2018年,楊立昆宣布卸任FAIR的職位,轉任首席AI科學家一職,接任楊立昆的是當時AML的領導者 Jér me Pesenti。這次調動不同的點在于,削弱了FAIR的獨立性,Pesenti同時擁有FAIR和AML兩個部門的話語權。楊立昆在一次采訪中這樣評價這次變動:「AML和FAIR向CTO彙報,隨著AI重要性、圍繞深度學習建立更多系統重要性的提升,CTO再也不用擔心了。」
楊立昆的「言外之意」其實有二:一是FAIR正在去集中化,這意味著未來將更多爲産品和業務服務。二是在當時Facebook陷入到了嚴重的監管,CTO必須要用技術解決公衆的信任危機,因此FAIR加大了在識別型AI的投入,以促進人工智能的公平、透明和可解釋性。
第二次重組則發生在2022年6月,Meta再次宣布FAIR重組調整,明確提出AI部門不再「集中化研究」,而是分布式的下放到每個組織部門中去。這項改動加速AI技術在Meta實際業務中的應用,而被引入到不同産品組的業務部被稱爲「AI創新中心」。其中,FAIR也將成爲Reality Labs Research旗下部門,就在一年前,Facebook正式改名爲Meta。
科技公司的組織變動非常常見,畢竟技術的變化太快了。但不同于微軟、蘋果等科技公司,FAIR之于Meta,兩次重組的不同點有二:
一是AI都是「救急」,而非創新。無論是用以服務社交媒體,識別與解決假新聞等問題,還是應對不成熟的VR業務,FAIR本身聚焦前沿技術的創新被大大稀釋了。
二是缺乏戰略的穩定性。「擁抱變化」盡管是科技公司經常挂在嘴邊的一句話,但參考微軟、蘋果的經驗,總有一個穩定長期的「主線」。例如,蘋果盡管市場被吐槽「擠牙膏創新」,但在圍繞C端的軟硬件叠代上始終放大自己的生態、供應鏈等核心優勢。
至此,如果回頭看看十年前扎克伯格給自己留的三個方向:連接整個世界、發展人工智能、虛擬現實,似乎三個都沒有助力其成爲TOP1。
重新變酷的Meta,不願再走老路
“我們可以發現的一點是說,Meta又變酷了。”曾在Meta擔任AI架構總監,如今創業的賈揚清如此評價Meta的新變化。
在由chatGPT所開啓的生成式AI浪潮中,之所以說Meta「重新變酷」的關鍵有二:一是區別于OpenAI等巨頭的閉源路線,Meta加入戰場的姿態是「開源」。
從LLaMA系列開始,Meta相繼開源了一系列的模型,包括視覺領域的SAM和DINOv2、音頻領域的AudioCraft系列模型、多模態大模型ImageBind等。而據紮克伯格的最新透露,Meta正在訓練Llama 3,且該模型具備更強的代碼生成能力。
而由LLaMA所引發的「開源和閉源」之間的討論已足以證明了Meta的變化。楊立昆曾這樣形容開源社區與閉源模型在生成式AI上的發展。“開源人工智能模型正走在超越專有模型的路上”。
第二個「重新變酷」的原因則是扎克伯格態度的轉變。區別于過去對增長的迷戀以及混亂的AI策略,無論是與微軟合作,還是宣布對開源大模型的押注,Meta的AI策略逐步從分散走向整合。具體來說,一是延續開源路線,加大AI生態的繁榮,這既符合對FAIR當初的承諾,也有利于在開發者和公衆間,改善Meta的形象。二是借助AI更快抵達元宇宙,一方面利用AI降低開發門檻,另一方面,發揮應用優勢,更好地優化體驗。
據「矽基研究室」梳理,區別于谷歌、亞馬遜等巨頭,Meta的AI能力主要集中在C端和視覺,包括圖像識別和目標檢測、圖像生成、增強現實(AR)和虛擬現實(VR)、人臉識別和人臉相關技術以及社交網絡數據處理和隱私保護。這些技術儲備在生成式AI時代具備先發優勢。
可以肯定的是,扎克伯格和他的Meta都不願重走過去的老路,曾經的AI王者是否能夠再度翻身,這是時代交給扎克伯格的新命題了,畢竟Meta所面臨的挑戰還有很多。
首先,是老生常談的Reality Labs的盈利問題。從Meta去年第三季度財報狀況來看,廣告業務強勢復甦,但VR/AR業務持續虧損。去年9月,Meta發布了首款消費級MR頭顯Quest 3,據天風國際證券分析師郭明錤的分析,Quest 3頭顯銷量將明顯少于最初的預期。據機構IDC的估計,2023年AR/VR頭顯的出貨量爲810萬台,同比下降8.3%,盡管有蘋Vision pro的熱度加持,但市場回暖依舊需要一定的時間。
其次,即便不走過去的老路,AI戰略已逐漸連貫,但比起微軟、OpenAI等巨頭,Meta想做的還是太多了。如「互聯網怪盜團」的評價,當所有科技巨頭都在集中投入AI這一個「研發焦點」時,Meta卻必須將資源分散在兩個「研發焦點」,這不可避免地要面臨資源和精力的分配問題。
時間撥回2012年,彼時Facebook尚未改名,面對當時股價的低迷、移動化戰略的失誤,扎克伯格回應道:“我能承受人們的低估,因爲我甯願被低估,這樣才能真正讓他們刮目相看。”如今在這場關于AI的新戰事中,扎克伯格回到了原點,他和Meta都急需一場勝仗。---來源: 钛媒體-
參考資料: 1、福布斯:楊立昆希望用開源戰勝OpenAI?
2、甲子光年:三次誤判後,扎克伯格這次終于做對了
3、遠川研究所:差一步稱霸AI:歷史進程中的扎克伯格
4、互聯網怪盜團:Meta的逆襲:扎克伯格到底做對了什麽?
5、深度學習革命,凱德·梅茨