01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

大模型價格戰開局40天:羊毛出在豬身上,AI獨角獸很受傷

2024061515:33



圖源:Pixabay

短短一年,大模型的賽製已經從資格賽進階至淘汰賽——剛剛邁過資金準入門檻的大模型廠商,火急火燎地卷進了價格戰的漩渦。

這場價格鏖戰始於私募巨頭幻方量化旗下的AI公司DeepSeek。5月6日,DeepSeek宣布開源第二代MoE大模型DeepSeek-V2,標價為GPT-4-Turbo的近1%,百萬tokens只需1元。

智譜緊隨其後,於5月11日稱個人版GLM-3Turbo調用價格從5元/百萬tokens降低至1元/百萬tokens。

4天後,字節跳動也加入了價格屠夫的陣營,打著低於行業平均價99.3%的旗號,宣布豆包Pro 32k模型0.8厘/千tokens,用戶花1元可獲取與5本《新華字典》相當的數據量。

接下來的一周內,阿裏、百度和騰訊等互聯網大廠和垂直賽道頭部玩家科大訊飛相繼釋放了降價信號。阿裏雲宣布通義千問9款模型一起降價,其中主力模型Qwen-Long直降97%;百度智能雲則直接宣布文心大模型兩大主力模型ERNIE Speed和ERNIE Lite免費;騰訊雲則稱,其主力模型之一混元-lite模型的價格從0.008元/千tokens調整為全面免費,其他模型降幅最高達87.5%;而科大訊飛則表示輕量級模型API永久免費。

實際上,OpenAI也是降價陣營的主力軍,其最新模型GPT-4o價格較GPT-4-Turbo再次減半,這是自2023年初以來OpenAI進行的第4次降價。按照OpenAI的預期,其大模型將以每年50%-75%的幅度繼續下調。

回溯出行、本地生活、新能源車等領域,每個賽道的決勝局都少不了價格戰。然而當前大模型盈利前景尚不明朗,價格戰卻早早脫胎於無形,競爭的激烈程度可見一斑。

「價格戰一般存在於行業中後期,即技術成熟、市場完善、競爭格局清晰之時,各占山頭的企業通過壓低價格來搶奪對手的蛋糕。」AI投資人劉柯(化名)向時代周報記者稱,大模型廠商間的比拼比新能源車領域還要猛烈,他們前期燒掉的資金還沒有收回來,急於投身價格戰無疑要承擔巨大的資金風險。

價格戰的早產,將本就金鼓連天的大模型賽道推向白熱化。

近日,估值10億美元的Stability AI資金鏈斷裂,正在尋求被收購;融資近5億美元的Adept,正在與互聯網大廠洽談出售事宜;清華系大模型公司銜遠科技傳出了人事變動。據悉,公司創始人周伯文已不再主持公司事物,多位業務負責人也在今年春節前後離職。每日經濟新聞報道稱,出現該變動的原因是公司「產品遲遲無法落地,商業化進展緩慢」。

另時代周報記者從一位AI投資人處獲悉,另一家清華系大模型明星企業深言科技也正經歷發展瓶頸。該投資人稱,深言科技創始成員大額套現,產品研發進展緩慢,部分團隊核心成員已將主要精力放回學業。時代周報記者就該問題嘗試聯系深言科技創始人豈凡超進行核實,截至發稿未得到回復。

大模型價格下調已成趨勢,廠商該如何平衡成本與支出?誰會是這場戰役的受益方?腰部大模型企業又該怎樣迎戰?

價格下跌一大截,技術前進一小步

大模型廠商的降價手段與互聯網企業有所不同。無論是網約車,還是電商和外賣行業,所謂價格戰往往通過巨額補貼來實現。而大模型的降價邏輯是通過技術手段的驅動,重構生產函數,提升研發效率來壓低成本。

隨著模型工程化、架構、系統手段不斷優化,推理成本的減少有效帶動了模型降價。DeepSeek-V2的一篇論文中稱,研發團隊利用MLA(Multi-head Latent Attention,多頭潛在註意力)結合 MoE(Mixture-of-Experts 專家混合模型),實現了模型性能跨級別提升,同時減少了計算量、推理現存及成本。

但推理成本的降低,只能算模型廠商們向前邁的一小步。零一萬物CEO李開復此前表示,整個行業每年降低10倍推理成本是可以期待的,而且必然也應該發生。「降低模型推理成本並不難,難的是探索模型綜合能力的上限,模型能力提升,才能帶來API商業模式的持續增長。」Minimax創始人閆俊傑也表達了相同觀點。

無奈在模型能力相近的情況下,國內廠商只能先簡後繁。

目前,大模型價格戰僅限於推理所用的token降價層面。token是自然語言模型處理文本的最小單位。大模型廠商在訓練出閉源大模型後,會將其 API(應用程序編程接口)出售給開發者並收取費用。這種主流商業模式的計費法則一般依靠token所對應的漢字、字母的使用量來計算。

token並非大模型的全部。下遊企業在獲取大模型API後還需通過投餵數據、微調等方式進行模型優化和部署,而這些成本依舊昂貴。比如阿里的Qwen-Turbo大模型,進行百萬個tokens推理只需要2元,若繼續進行訓練,則需要花費30元,具體部署時,每月則需要2萬元。

而百度雲的千帆大模型平臺雖然有兩款大模型可以免費調用,但是模型部署、精調、評估、數據管理、插件調用等環節都需要按量付費。以最基礎的模型部署為例,客戶租賃5天私有資源池至少需要7000元。

時代周報記者還註意到,大模型廠商的降價並沒有覆蓋全線產品。如阿裏里、百度降價幅度最高的產品都是其輕量模型,主要適用於使用頻次不高、推理量不太大、任務處理量不太復雜的中小企業、開發者在短期內使用。

顯然,大模型企業見縫插針卷價格,很大程度上還是為了製造噱頭吸引用戶,以緩解API這一模式的增長焦慮。

為了提高大模型的API調用量,大模型廠商始終不遺余力地探索降低AI應用門檻的方法,讓更多的人先用起來。百度雲在2023年曾推出了模型開發工具Model Builder 和AI應用開發工具AppBuilder。今年4月,其又聯合有渠道、場景的供應商一起合作服務客戶,希望進一步拉升文心大模型標準化的API 調用量。

百度公布的最新數據顯示,文心大模型日處理文本2500億 token,另一大廠字節跳動日均處理 1200億token。這其中很大一部分是公司內部業務在調用做AI 應用和業務探索。可見,標準化的模型 API 並沒有迎來確定性的增長。

2023年年底,The information稱OpenAI的年度經常性收入已經達到了16億美元,只不過,如此體量的營收相比其百億美金級別的研發成本而言也還是杯水車薪。

羊毛出在豬身上,價格戰餵飽雲廠商

官方辭令背後,這場價格戰更像是雲廠商在另一賽道布下的戰局——用低價的大模型引流,帶動背後公有雲服務的銷售。IDC數據顯示,2023上半年中國大陸公有雲市場同比增速放緩至15.9%,這一增速在2023下半年進一步放緩至9.5%。

官宣降價後,阿裏雲智能集團資深副總裁、公共雲事業部總裁劉偉光表示,公有雲的技術紅利和規模效應,帶來巨大的成本和性能優勢,能大幅壓縮模型推理成本、加快推理速度。

隨後,在百川智能新一代基座大模型Baichuan 4的發布會上,創始人王小川表示,價格戰核心要看背後的商業模式是什麽,如果是做to B服務的,降價的根本目標不是為了賣大模型本身,而是帶動整套雲服務的銷售。這推動雲廠商從偏傳統的服務模式,進入到一個新戰場。

獵豹移動董事長兼 CEO傅盛也在朋友圈發文稱,這次價格戰,降得最兇的都是有雲服務的大公司,通過大模型來獲取雲客戶,羊毛出在豬身上,降得起。

此前,大模型為公有雲帶來的增量很小。拿百度舉例,2024年一季度百度雲收入為47億元,同比增長12%,其中6.9%的雲收入來自外部客戶使用大模型及生成式AI相關服務。以此測算,當季生成式AI給百度雲帶來的收入約為3.24億元。

阿里雲在大模型降價後的第二天就推出了上雲優惠。包括首次推出5億元算力補貼,以及為200余款雲產品製定折扣價,這些產品包括覆蓋GPU、雲服務器、大模型訓練與推理服務等產品。

「『公有雲+API』被認為是企業使用大模型更具性價比的模式,哪怕AI利潤暫時比較薄,只要有足夠多的客戶上公有雲,雲廠商便能吸引用戶購買計算、存儲、網絡和安全等基礎產品。」科技分析師李笑霖告訴時代周報記者。

李笑霖還表示,低價策略主要利好to B的大模型廠商。「隨著越來越多的開發者被吸引進來,更多新的落地場景將隨之被激活。而隨著公有雲和算力規模效應的逐漸顯現,會進一步反向壓縮模型廠商的成本。等待行業整體豐富起來,模型廠商還將獲取源源不斷的應用產品生態捆綁以及垂直模型的優化方案。」

「應用產品與通用模型適配得越牢靠,意味著模型廠商與客戶綁定越緊密,下遊企業將持續為模型廠商支付運營費用,而轉換平臺要面臨昂貴的轉換成本。」李笑霖補充道。

價格戰早產,是大模型創企之殤?

大廠氣勢洶洶打價格,大模型創企卻應聲者寥寥。

原因在於,大模型創業公司如今都認可「雙輪驅動」戰略,認為只有既做通用模型,又做產品才有未來。但顯然,模型所需的資金、人才和GPU集群都是稀缺資源,產品所需的營銷、渠道也意味著大額消耗。創業公司們明顯不舍得丟掉手中為數不多的籌碼投身價格戰。

李開復表示,ofo(共享單車)式的瘋狂降價是雙輸的打法,大模型公司不會這麽不理智,因為技術還是最重要的,如果是技術不行,就純粹靠貼錢賠錢去做生意,「我們絕對不會跟這樣的一個定價來做對標」。官網顯示,零一萬物最新發布的閉源大模型Yi-Large,每百萬tokens價格20元。

王小川則說,這次B端降價,不是生產關系改變,而是直接做生產力供給,將AI直接供給生產力,「這件事情對我們而言,就是別摻和進去」。

「目前大模型賽道是錯位與同質化競爭並存的狀態。各家技術差距不大,但也具備相對差異化的產品。好在市場還不成熟,蛋糕尚且未被瓜分,明星創企依然有出頭的機會,但需要找到萬無一失的應對策略。」劉柯向時代周報記者稱,資本是逐利的,此前歷經數輪融資的創業公司也到了向投資者遞交成績單的時刻,但技術大山連綿起伏,商業化前景也不夠明朗,下半年行業或將面臨洗牌,一些企業很可能在此節點就與賽道無緣了。

傅盛認為,這次大降價基本宣告了大模型創業公司必須尋找新的商業模式。

劉柯稱:「創業公司資金實力不如可以依靠雲業務造血的大廠,因此一味拼低價顯然是沒有生存空間的,如果要向應用層延伸,或者打造AI原生,也不能忽略大廠的圍追堵截。AI搜索、AI Agent等熱門應用都有大廠在布局,況且現有的大模型能力還不足以支撐一個超級APP的誕生。」

假如深入B端交付業務,也意味著大模型創企或將為了迎合國內市場,面臨為紛繁的客戶做精細化定製的處境,最終要舍棄掉與AGI相匹配的估值。

劉柯表示,明星創企不妨與專註於某一領域的大模型開發和服務平臺,與大廠合作,作為其ISV服務商,來為大廠提供某些專項場景所需的軟件服務系統,「剩者為王,是大混戰時期的生存哲學。」---[文源:時代周報/作者:申謹睿]