李彥宏說透了國産大模型的現在與未來-(1)
“中國的大模型很多,但是基于大模型所開發出的AI原生應用卻非常少。”
11月15日,深圳2023西麗湖論壇上,百度創始人、董事長兼首席執行官李彥宏對國內AI市場給出的研判。
作爲《時代》周刊所評選的全球AI領袖企業創始人,李彥宏留給人們的印象,一直是人工智能行業最堅定的支持者。
過往幾個月裏,身處AI賽道廣闊前景之中“振奮感”,幾乎貫穿了他的每一場公開演講。即便是私下裏爲《智能革命》一書作序,他也毫不掩飾對于行業的期待:
“全世界都在爲即將到來的人工智能革命感到興奮。”
而在剛剛結束的西麗湖論壇上,面對國內大模型領域的“過熱”現象,這個小小的傳統被打破了,取而代之的則是一盆迎面的“冷水”。
正如他在演講開頭,抛出的那句直切主題的開場白一樣:人工智能很熱,但我想首先談幾個‘冷’思考。”
1、熱過的大模型,何時“退燒”?
大模型賽道很火爆,這是過去的大半年裏,各界人士都能直觀感受到的現象。
然而,只有行業中感知最敏銳的那批人才能意識到,當下的大模型賽道,不僅廣受關注,而且已經有了明顯的“過熱”迹象。
當下,人工智能行業“模型層—中間層—應用層”的宏觀架構之中,大模型已經躍馬當先,成爲了占據絕對資源優勢的主角。
“人工智能每收獲1塊錢投資,就有6毛錢流向了大模型。”
這個類比並不誇張,數據統計現實,2023上半年,國內人工智能領域共發生161起投融資事件,其中超過半數投融資直指算力設施和大模型業務,而涉及具體應用側面的,不足四分之一。
從發布大模型的時間節點來看,國內的大模型訓練起步,平均要晚于美國3年左右,然而據钛媒體《2023AI大模型應用中美比較研究》報告顯示,單從數量來看,截至2023年7月底,國內市場已經累計問世了超過130個大模型,甚至超越了同期的美國市場。
大模型超量湧現的另一邊,正如李彥宏所提到的那樣:
“很多行業、企業,甚至很多城市還在買卡、囤芯片,建立智算中心,想要從頭訓練自己的專用大模型。”
這種反常的“過熱”背後,是越來越多從業公司、投資者和企業品牌的集體“迷失”。
對于從業公司來說,大模型之于AI行業,猶如操作系統之于互聯網産業,是不折不扣的“基礎設施”,無論是短期紅利還是長期前景,都非常可觀。
而對于投資人來說,入股算力中心、開發大模型也是“更保險”的商業行爲,一方面,AI的中間層和應用層還沒有跑出類似ChatGPT、文心一言這樣的頭部企業,缺乏現有案例參考,另一方面,相較于看不見的原生應用,買實體芯片、建算力中心更能直觀的看見資金流向,從而幫助平衡投資風險。
最後,很多企業對此更是理解不深,順著媒體和輿論的炒作,以爲擁抱人工智能就是引入大模型,最終誤入歧途,造成了對公司資源和社會資源的巨大浪費。
回望過去,各方複雜的博弈與思考,鑄就了如今大模型的“過熱”現象。
長期來看,這一現象所帶來的危害已經逐步顯露:
人工智能産業架構中,相較于模型層的落後,應用層本來可以成爲國內市場彎道超車美國的機遇,然而當前過熱的大模型賽道,虹吸了過多本該投放于應用層的資源,來“重複造輪子”,拖累了應用層的木桶板。
對此,李彥宏同樣深有感觸:
“人類進入AI時代的標志,是出現大量的AI原生應用,而不是出現大量的大模型。”
從這個角度來說,國産大模型,或許是時候該吃上一劑“退燒藥”了。
2、AI原生帶來的改變,才剛剛開始
類比互聯網産業,操作系統所衍生的紅利,固然成就了微軟這一矽谷巨擘,但硬件層的英特爾、英偉達,軟件層的亞馬遜、谷歌、Meta、Netflix,以及産品終端的蘋果、三星、華爲等企業,同樣向世界诠釋著其他産業層級所蘊含的豐厚機遇。
同樣的,人工智能産業要想收獲長足發展,也必須要實現各個層級的均衡發展,多點開花。
當前階段,意識到這一點的矽谷,已經開始了“各就各位”的新發展階段,圍繞相對成熟的大模型工具,開始朝細分方向衍化新應用。
參考美國的人工智能市場發展階段,“AI原生應用”的崛起,需要兩個前置條件:
·底層的基礎設施——大模型已經具備了較爲成熟的能力
·頭部大模型已經實現了市占率領先,圍繞大模型的內卷告一段落
對應OpenAI的高市占率,在國內大模型市場,以文心一言爲代表的頭部大模型,已經成爲了開啓“AI原生時代”的關鍵鑰匙。
從技術水平來看, 新發布的文心4.0在理解、生成、邏輯和記憶四大能力上,已經迎來顯著提升;正如李彥宏所提到的那樣,“4.0是迄今爲止最強大的文心大模型”。
具體而言,在生成能力上,文心一言除了生成文字內容,還包括了圖片、視頻、數字人等多模態內容,可實現的創作體裁超過200種,涵蓋了幾乎所有寫作需求。在邏輯和記憶能力上,相比之前的版本也有了成倍提升。
另一側的市場占有率上, 文心大模型更是“遙遙領先”。
截至10月中旬公布的數據,文心一言面向全社會開放以來,用戶規模已經達到7000萬,開發者5.4萬,場景4300個,應用825個,插件超過500個。具體到調用量數據,也如李彥宏所說“可能比國內200多家加起來的調用量還大”,並且還在不斷呈現指數級的增長趨勢。
從這個角度來說,伴隨著文心一言等頭部大模型的逐步成熟化,國內大模型市場千帆競逐、野蠻生長的初級階段,已經從事實上宣告結束。
基于這一背景條件,對于國內當前的人工智能市場來說,圍繞文心一言等頭部大模型,開啓應用層的“AI原生時代”,已經是“正當其時”。
這也是爲什麽,李彥宏在演講的開頭重點呼籲:
“如果我們能夠更加鼓勵基于大模型的AI原生應用,就一定能夠構建起一個繁榮的AI生態,推動新一輪的經濟增長。”
3、繁榮AI應用生態下的“百度解法”
在中國的科技大廠中,百度是最早一批確立AI爲核心戰略的企業,在過去諸多公開場合中,李彥宏對AI的熱情貫穿始終,百度也在“一號位”的帶領下,率先自上而下完成AI重構。
但正如李彥宏在演講中所說的:“我認爲直到今天,中國也好,美國也好,最好的AI原生應用還沒出現。”
這句研判並非沒有根據。紅杉資本在其刷屏報告《生成式AI進入第二階段 》中提到,當前市場正在進入“第二幕”,一切的炒作最終會被真正的價值和完整的産品體驗所取代。
從全球範圍來看,無論如微軟、谷歌這樣的科技巨頭,還是OpenAI這樣的獨角獸,都在利用AI原生應用夯實自身的護城河,這已是確定性的趨勢。微軟雖然自己不下場最大模型,但借助和OpenAI的聯盟,已完成Office全家桶的AI化,另一邊的OpenAI則在最近的開發者大會上,直接推出了GPT Store,呼籲個人與開發者打造自己的專屬GPTs。
也正是這種對技術價值的長期研判,催生出李彥宏的呼籲:“我們需要的是100萬量級的AI原生應用,而不是100個所謂的大模型”。
當價值錨定,剩下就是如何去做,如何真正開啓一個健康、繁榮的“AI原生時代”?
事實上,李彥宏與百度想的也非常清楚:這不是一道靠一家或兩家企業完成的選擇題,而是一道需要多方合力共同參與的開放題。
首先,擁抱AI時代,必須是一項“一把手、一號位”工程。 在李彥宏看來:“大企業天然保守,對新生事物不敏感,不願意冒險”。他提到一些行業亂象,比如,很多企業只認爲擁抱AI是IT部門的事,要麽天馬行空地想要從0到1自己去大煉基礎模型,要麽就只看評測榜單選一個模型,最終的結果只會造成資源浪費。
如何避免內耗,發揮AI真正的價值,李彥宏給出的解法是企業的“一號位”。這一點也並不難理解。一方面,沒有人比一號位更關注新技術對業務關鍵指標所起的作用,另一方面,只有自上而下的意志傳達,形成統一共識,才能實現合力。
李彥宏是這麽說的,百度也是這樣做的。 正如上文所提到的,百度率先自上而下完成AI重構的中國企業,不僅是各産品線的AI原生化重構,更是上下意志的統一。
其次,技術必須服務需求,從具體的行業場景與業務場景找痛點,與技術做結合。 現在很多企業都在陷入一種算力恐慌,但正如李彥宏所說的“無論是芯片也好、框架也好、模型也好,都需要AI應用來驅動。”
換言之,只有通過更多的場景應用,才能驅動算力和數據步入正循環軌道。
最後,更好的生態才能催生更多的創新。 中國的大模型廠商不能閉門造車,讓AI真正實現普惠必須降低門檻,爲更多企業、開發者與個人提供更便捷的工具鏈與解決方案。
“百度從做AI的第一天,就非常重視生態的建設”。李彥宏這樣說。目前,百度飛槳已擁有800萬AI開發者,不久前,百度發布的文心一言插件生態平台“靈境矩陣”,相當于爲大模型提供了“手和腳”,插件以一種以輕量化的形式,降低了使用門檻,讓用戶科技結合自身的業務場景與需求,快速創新,進而真正發揮讓大模型的通用能力真正落地于場景。
插件生態之外,對于一些企業級與行業客戶而言,如何讓大模型更好地落地産業,關鍵要讓大模型用的順手、用的長久,百度智能雲千帆大模型平台就通過更完善的大模型産品、工具和服務,目前已有超17000家企業在這裏開發産業模型和解決方案。
對李彥宏與百度來說,他們足夠熟悉AI,也靠著多年的AI蓄力等來了如今的蛻變重生,在西麗湖上的這份冷思考與熱驅動,某種程度上,是李彥宏的真心話,也是百度經曆過AI時代完整周期的經驗總結與價值理解。
正如Robin在演講最後所提到的那樣:
“希望每個人都行動起來,去使用它、體驗它、投入到AI原生應用的創新中,共同創造一個百花齊放、無限可能的AI原生時代。 ”