大模型降溫背後的難點、卡點、節點
進入2024年,大模型似乎有熄火之勢:資本市場,與之關聯的概念炒不動了,英偉達股價動輒暴跌重挫,引發「泡沫戳破」的擔憂;
消費市場,BATH們的推新活動少了,產品更新疊代的速度慢了,民眾的關註度降了……
熱鬧的大概只剩下兩場酣仗:自5月15日字節跳動宣布「以厘計費」,打響國內大模型「價格戰」的第一槍,百度文心、訊飛星火、阿裏通義、騰訊元寶等紛紛跟進;
同時,地鐵、寫字樓、機場等白領人群密集區域,百度文心、訊飛星火、阿裏通義、騰訊元寶、華為盤古的Slogan,你方唱罷我登臺,貼臉營銷如槍林刀樹。
「海水」與「火焰」交融的場面,不得不讓人思考,大模型的出路究竟在哪裏?難點、卡點、節點又是什麼?
01, 難點:盈利難&落地難
強如OpenAI,也面臨「恰飯」的難題。
援引外媒報道,OpenAI預估虧損50億美元,全年運營總成本高達85億美元,照此估算,其現金流大概率在一年內耗盡。
而在一篇題為《How does OpenAI Survive》的長文中,作者對OpenAI的商業模式產生了質疑:
「OpenAI的營收在35億至45億美元之間,但其運營虧損可能高達50億美元,其收入遠遠無法覆蓋成本。而為了推出下一代的大模型GPT5,OpenAI需要更多的數據和算力,這又是一大筆花費。」
說千道萬,靠著「碎鈔式」的大力出奇跡後,大模型卻仍未找到一條合理的盈利路徑。
據《節點財經》觀察,市面上的大模型,大部分都采取To C+To B,即會員訂閱+開發者API調用「兩條腿」走路。
但無論是To C,還是To C,能一上來就產生付費的寥寥無幾,若再刨除重負的減項,多半是鼻子大過臉。
以本土大模型先行者百度為例,2024年Q1,其雲業務收入為47億元,同比增長12%,其中6.9%來自外部客戶使用大模型及生成式AI相關服務,約為3.24億元。
而在2023年Q4,大模型為百度雲貢獻了6.6 億元增量收入。
這是國內唯一披露大模型收益的廠商,本身又是家大業大,有底氣拼到底的巨擘。但只談創收,忽略創利,就是耍流氓。
可想而知,其余不敢明示賬目的選手,內心有多迷茫、煎熬。
不掙錢,難掙錢的背後,是大模型落地難的窘境。
雖然大佬們高呼「ChatGPT」的問世是「iPhone時刻」,第四次工業革命,新一代的「火」和「電」,但坦率地講,當下大模型還有很多局限性,包括認知偏差、能動性欠缺、泛化性能弱、幻覺等。
比如,數值運算就是大模型明顯的弱項,或者說大模型是妥妥的「文科生」,做數學題的智商可能連二、三年級的小學生都不如。
《節點財經》親測,在Kimi輸入:「9.11和9.8哪個大?」一頓啰嗦後,Kimi給出了完全不正確的答案。
圖源:Kimi官網
比如,大模型資料更新不及時,必須外掛知識庫才能在一定程度上緩解這個痛點,並且還是無法完全解決「一本正經地胡說八道」的尷尬。
前幾天刷屏的SearchGPT,就在各地網友興致勃勃等待灰測展現AI搜索的「洪荒之力」時,《大西洋月刊》澆了一盆冷水,眼尖的記者發現:
問的是關於「八月份北卡羅來納州的布恩音樂節」的細節,SearchGPT的回答分為5條,3條裏包含事實錯誤——有的是把舉辦日期弄錯,有的是把距離和車程搞混,有的是把場館網址張冠李戴。
再如,大模型絕對是「健忘癥」患者,我們在和它對話時,尤其是多輪對話時,難免要化身「復讀機」,一遍一遍重復相同的話術。
而在B端,因為實戰經驗不足,生分於對方的Know-How,加之環境的復雜多變性,大模型面臨的挑戰更艱巨。某業內人士表示,迄今大模型在行業中尚沒有一個成熟的案例。
02, 卡點:數據、算力、成本
深入肌理地分析,大模型的「落地難」又與自身的三大卡點:數據、算力、成本息息相連。
➊ 卡在數據
如果把大模型比作一頭巨獸,那它的顯著特征之一便是「不停進食」:需要高質量、大面積的語料做長久期、高頻次地投餵、催肥。
換言之,「食物」的品質、多寡、新鮮度、多樣性等,決定了大模型的疊代進度和學習效果。
無疑,這對數據的挖掘、獲取提出嚴峻考驗,關系到各方的權益保障、利益分配、版權歸屬等,通常涉及到敏感信息時,數據的清洗、標註、脫敏又會很繁雜。
前陣,免費網文APP番茄小說因一份「AI協議」引發軒然大波。根據該份協議,平臺可以將簽約作品,含名稱、大綱、簡介、章節等,作為「哺育」AI大模型的素材,用於各種應用場景,如智能對話、智能文本創作等。
不過,這一舉動遭到作者的普遍反對,認為其不僅威脅網絡寫手的生計,還損害了原創內容的價值,甚至發起聯合斷更以示抗議。
➋ 卡在算力
如果把AI鏈路比作一間工廠,那麼算力便是維持工廠運轉,量級誇張且進價不菲的「燃料」(煤、石油、電力等)。
公開資料顯示,初始ChatGPT匹配的算力是1萬塊英偉達A100(AI芯片),花費超過7億元。後續調優每天消耗的算力大概是3640PFLOPS,即7至8個算力達500PFLOPS的Data Center的支撐,整體基建開支以百億計。
按照廣發證券的測算,在暫不考慮軟件層面算法優化的前提下,本土AI大模型在訓練與判斷、預測階段所需算力,相當於1.1萬臺或3.8萬臺(樂觀假設下)高端AI服務器,大致對應約126億元到434億元的資金體量。
進一步地,隨著大模型規模狀大,算力需求會倍數遞增,已然超越硬件的摩爾定律。據悉,ChatGPT從1.0到3.0,參數量從1.17億狂飆到1750億。
而目前,我們在算力這塊既面臨外部「卡脖子」,內部建設又相對落後,碎片化、傳輸慢、協同難、人才緊缺等「痼疾」亟待突破,導致大模型的實效遜於國外。
「大模型只有兩個梯隊,OpenAI和Others,國產用哪家都一樣」,多位AI從業者談道。
➌ 卡在成本
大模型「桎梏」於算力,實際也是「桎梏」於成本。
計算機飛入千家萬戶,售價下探,變得親民、接地氣,很關鍵;智能手機能人手一部,物美價廉的小米功不可沒;新能源汽車的熱賣,離不開動力電池的「跳水式」降價……
從人類歷史的進程看,任何一項新技術的推廣、普及,都離不開對成本的有效、大力壓縮、控製。
硬幣的背面,是科技發展和工業文明進步共同作用下,製造效率、運算精度提升,人均產值拔高,各類物料愈發便宜等因素集結的強大驅動力,進而減輕C端、B端「太貴了,買還不買」的糾結。
大模型同理,浩大的開支也是其成長途中的「絆腳石」。試想,當生態裏只有唯一的「賣鏟人」(英偉達)賺錢,賺頭還不小,怎麼可能持續呢?
好消息是,今年2月末,李彥宏透露,自發布以來,百度不斷降低文心大模型在推理方面的成本,已降至去年3月版本的1%。
03, 節點:在產業裏「種植」大模型
毋庸置疑,大模型仍有諸多「短板」和缺陷,但新技術的魅力向來在於探索「無人區」,跋涉「深水區」。
很多眼下看似微弱的「火種」,往往都孕育著日後「納須彌於芥子」的宏壯。盡管迄今為止的大模型,大家都是拿著錘子找釘子,但我們已經看到,其正逐步向產業邁進,嘗試扮演了一些淺層的Agent的角色。
最醒目的標識便是,大模型不再坐而論道,只會聊天、寫詩、作畫,而是起而動之,走出實驗室,去往礦區、政務、金融、醫藥、金融、物流等具體領域,努力兌現自己的終極使命。
比如,在礦區,下井工人常年深陷光線昏暗、浮塵彌漫的環境,疊加經年累月高強度的勞碌,使不少人都患上了風濕、耳鳴等職業病,更甚者,還可能遭遇瓦斯、透水等意外,但礦區作業又十分依賴人力,特別是主運系統巡檢。
華為的盤古礦山大模型這時候便派上用場了。其覆蓋煤礦的采、掘、機、運、通、洗選等流程下的1000多個細分場景,用AI取代人成為主運智能監測系統的眼睛,能夠精準識別大塊煤、錨桿等異常情況,異物識別準確率達98%,動作規範識別準確率超過95%,且全時段巡邏助力工作人員,避免因漏檢造成的安全事故,縮短停機時間。
京東表示,基座大模型是靠卡訓出來的,企業大模型是靠人用出來的。
物流領域,攬收、派送、分揀、輔助,應對突發事件等,快遞員每天都背負著繁重的任務,還要熟悉貨物處理規程、安全操作標準、客服要求等多達上百個規範,把這些統統記牢,肯定要耗費大把功夫,還容易混淆。
京東言犀大模型的小哥終端助手大大化解了上述煩惱。它告別了只「動腦」的境界,能直接「下手」,快遞員動動嘴,小哥終端助手就能立即將送貨通知發給客戶。如今,小哥終端助手為JD商城近35萬自有配送員「效勞」。
再如,零售行業,基於京東言犀大模型的AIGC營銷工具「京點點」,不僅可以幫助商家一鍵出商品圖,還支持了超過2000種視覺元素道具;不僅可以豐富吸睛資源和表現力,還能依循商品屬性、特點和宣傳想要的個性化布局,實時、自主撰寫創意賣點、種草文案、直播腳本等。
總的來說,把大模型「種植」在產業裏,讓大模型在產業裏生長、發芽,儼然是現在大廠的共識,必須攻克的難關。長遠看,該共識亦如「星星之火」終會燎原曠野。
當喧囂過後,大模型這場豪華遊戲,能留在牌桌的玩家,註定只是少數。
面對數據、算力、成本等現實問題,供需兩端漸漸回歸理性。可以預見,在真「好用」和能「吸金」之間,大模型還有很長的路要走。---[文: 節點財經,作者: 崔大寶/來源: 鈦媒體]