01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

大模型卷向下半場:價格戰之後如何成為真正「剛需」

2024060413:14



2022年年末,聊天機器人ChatGPT一炮走紅後,2023年國內湧現出兩百多個大模型,被稱為大模型元年,一時間掀起「百模大戰」。而從今年5月開始,在幾家大型廠商的帶領下,大模型價格戰愈演愈烈,國內「百模大戰」步入新階段。

6月3日,澎湃新聞正式推出一線財經大調研直播——《超級公司》。首期走進國內一線人工智能公司商湯科技,商湯科技聯合創始人、大裝置事業群總裁楊帆告訴澎湃新聞記者,各家廠商都是在盡可能多地去獲取用戶,「大家的一個共識是,兩三年之後這一輪大模型應用的用戶可能是今天的10倍、100倍。

時間回到半個月前。

5月15日,字節跳動在火山引擎原動力大會上正式發布豆包大模型,被認為是吹響了大廠大模型價格戰的號角。隨後,阿裏、百度、科大訊飛、騰訊紛紛加入降價行列,甚至直接宣布主力模型免費。

據字節方面介紹,豆包主力模型在企業市場的定價只有0.0008元/千Tokens,0.8厘就能處理1500多個漢字,比行業便宜99.3%。根據火山引擎公布的價格計算,一元錢就能買到豆包主力模型的125萬Tokens,大約是200萬個漢字,相當於三本《三國演義》。

一周後,5月21日,阿裏雲宣布,通義千問GPT-4級主力模型Qwen-Long,API輸入價格從0.02元/千tokens降至0.0005元/千tokens,直降97%。這意味著,一元可以買200萬tokens,相當於五本《新華字典》的文字量。同一天,百度智能雲在幾小時後宣布,文心大模型兩大主力模型全面免費。

5月22日,科大訊飛跟進降價,宣布訊飛星火API能力正式免費開放,訊飛星火Lite API永久免費開放,頂配版(Spark3.5 Max)API價格為0.21元/萬Tokens。騰訊雲也在當天宣布,混元大模型全面降價,其主力模型之一的混元-lite模型價格從0.008元/千tokens調整為全面免費。

而在更早之前,國內大模型公司智譜AI宣布,個人版/入門版GLM-3 Turbo模型調用價格由5元/百萬tokens降為1元/百萬tokens,相當於0.001元/千tokens。幻方量化旗下DeepSeek(深度求索)也在發布第二代MoE模型DeepSeek-V2時,稱其「性能比肩GPT-4」,並報出每百萬token輸入1元、輸出2元(32K上下文)的低價。

大模型價格戰,到底在「打」什麽?

免費的只是基礎版。科大訊飛就曾在投資者關系活動上表示,訊飛人工智能開放平臺面向全行業提供人工智能能力和整體解決方案,以免費+扶持的策略為主,基本能力免費,對於其他企業做不了的、性能更高的、個性化的定製服務收費。

在大模型「開卷」低價的背後,有技術進步的支持、爭奪市場的需求,也有更加現實和長期的考量。

百度智能雲也有千帆·行業增強版,在大模型服務方面,企業可以在千帆平臺上自由選擇不同參數規模、不同上下文長度、不同細分領域的大模型,然後按需擴展行業模型、行業知識、行業智能體。不過,百度並未公布千帆·行業增強版的具體價格。

宣布降價後,火山引擎總裁譚待在接受澎湃新聞等媒體采訪時,談到了大模型的定價策略:「背後主要有兩個原因:第一點是我們能做到,第二點是我們需要這麽做。」他介紹,火山引擎在技術上有非常多優化手段,可以降低大模型成本,在工程上可以通過分布式推理的形式將底層算力使用得更好;另外,在混合調度方面,可以把不同負載作為混合調度,這樣的成本也大幅下降。

阿里雲相關人士也對澎湃新聞記者表示,能夠推出低價大模型「主要靠技術層面」。

據研究機構IDC預計,2026年中國AI市場的規模將達到264.4億美元,2021年至2026五年復合增長率(CAGR)將超20%。有了技術的支持,在競爭激烈的市場內,廠商開始「卷」起低價。

楊帆向澎湃新聞記者表示,各家廠商都是在盡可能多地去獲取用戶,「大家的一個共識是,兩三年之後這一輪大模型應用的用戶可能是今天的10倍、100倍。如果是這樣,今天花多少錢去獲客都是不虧的,這意味著你占據了先手。所以從這點上來講,很多C端(客戶端)的應用和互聯網早期有一定的類似性」。

順福資本創始人、行行AI董事長李明順也指出,為了爭奪市場占有率,大模型價格戰的到來是「必然的」。隨著規模效應的展開,「笑到最後的肯定能賺錢,這個就是定價策略的問題」。

此外,有多位業內人士對澎湃新聞記者談到,價格戰也是一種促進AI應用發展、培養行業生態,並為廠商收集數據的手段。

在宣布降價的阿里雲武漢AI智領者峰會現場,阿里雲智能集團資深副總裁、公共雲事業部總裁劉偉光坦言:「阿里雲這次大幅降低大模型推理價格,就是希望加速AI應用的爆發。我們預計2024年大模型API的日調用次數有望突破100億。」

作為基礎大模型與用戶端之間的「中間廠商」,瀾碼科技的CEO周健表示,價格戰出現的本質原因其實是各大廠商之間在競爭數據,「大模型廠商實際上在燒錢進行大量的投入,有點類似於當年『百團大戰』、滴滴和快的打車競爭的格局。我認為,大模型廠商並沒有太考慮定價能否cover(覆蓋)成本或帶來利潤,從大模型廠商的商業策略講,現在降價的主要目的更多還是收集數據,在投入期,沒到能夠賺錢的地步。」

周健進一步指出,大模型企業希望能有更多的C端,找到不同的場景,而不再去強調做了多少億參數的模型、是GPT-4的七成、八成還是九成。

步入新階段後,大模型如何成為「剛需」

不過,對於價格戰是否意味著百模大戰已經進入下半場,業內人士有不同的觀點。

李明順認為,價格戰意味著大模型進入一個新的局面,但並不是大模型的下半場,「現在僅僅是大模型企業在C端競爭過程中,進入到肉搏階段。」

作為大模型行業內的初創企業,製作API集合工具包的藍雨AI聯合創始人北山也對澎湃新聞記者表示,這次價格戰或許只是一次「比較小的波瀾」,對於C端客戶來說感受並不強烈。但在資本要素等多種因素的影響下,大模型價格戰「可能會一直持續到出現一個壟斷式的爆款」。

經歷過價格戰之後,競爭激烈的大模型賽道究竟會走向何方?

據億歐智庫發布的《2024中國「百模大戰」競爭格局分析報告》,通用大模型歷經創業爆發期,預計市場將於2025至2026年逐漸出清,優勢企業堅守戰場,剩余企業陸續退出競爭;2027至2028年,通用大模型市場將呈現寡頭競爭格局。垂類賽道則將成為大模型產業激烈競爭的領域,預計在2023至2024年,部分行業場景率先落地;2029年以後初步市場出清,各細分行業呈現碎片化競爭格局,應用層獲取的市場價值日趨增長。

目前看來,不管是對企業用戶還是對個人用戶來說,大模型都尚未成為一種「剛需」,這或許是最需要廠商攻克的一大難題。

北山強調:「這個行業目前遇到的一個最大的卡點,其實不在於成本,而是沒有一個大模型或者應用,能夠讓大部分用戶不用不行。」

楊帆也對澎湃新聞記者表示,中國很多的應用還沒有被真正激活和打開,「更多的熱潮其實是來自媒體、投資圈的關註,90%甚至99%的人,可能都沒有真正的日常地去使用體驗或者感受到這樣的技術。」

楊帆認為,技術的進步只是一個維度,更多的維度是怎麽樣去跟進、去保持,以及怎樣讓這些技術真正的成為應用,成為每一個場景中和每個人日常生活息息相關的東西,「技術的進步如果不能夠解決現實問題,它就是炫技的『屠龍之術』,沒有意義」。而對中國而言,更有意義和更有價值的,就是應用落地的優勢,以實用為本。

騰訊雲副總裁、騰訊混元大模型負責人劉煜宏在接受澎湃新聞等媒體采訪時,曾談及對於大模型「內卷」的看法,稱現在的大模型能力還遠遠達不到高頻的用戶需求,和場景匹配度較低,導致滲透率還不足。

此外,如何找到適合自己的商業模式,也是大模型廠商要面對的長期問題。

李明順表示,目前,尤其在C端(客戶端),大模型還沒有找到最佳的商業模式,通過會員收費(的模式)已經被價格戰削弱。但從長遠來說,這也許是可行的,因為人工智能可以結合一些應用,比如說C端的社交,還有各種平臺的娛樂屬性,打造出新型產品。

李明順進一步指出,目前的價格戰,有利於有流量的公司,而一旦有了市場占有率之後,不管是什麽樣的產品形態,都可以像互聯網模式那樣進行收費。在B端,也可以搶占更多的產業的場景,把自家的大模型嵌入進去,但大模型企業也正面臨和互聯網一樣的問題,也就是「在產品技術沒有絕對領先、產品同質化的情況下,如何獲取用戶」。

關於大模型企業是否已經突破之前的算力問題,周健向澎湃新聞記者表示:「算力瓶頸實際上是在訓練端,不是在推理端,推理端可以通過小型化之類的方法解決。除了算力,大模型企業現在面臨的是場景問題,也是產品本身定義的差異化問題。通過降價的方式去收集數據,也是為了確認什麽樣的場景適合誰,進而做差異化競爭。」---來源: 澎湃新聞-



*AI時代,算力基礎設施如何賦能數字中國?*

AI技術也成為當下建設數字中國的重要抓手,而作為AI技術重要支撐的底層算力基礎設施又將如何發展,才能滿足當下各行業對AI技術的需求,已經成為當下的重中之重。

日前,第七屆數字中國建設峰會在福州舉辦,本屆峰會以「釋放數據要素價值,發展新質生產力」為主題,而AI作為當下釋放數據要素價值,以及發展新質生產力的重要技術,自然成為了各方關註的焦點。

從數字化到數智化,智算時代已至

在ChatGPT問世以前的很長一段時間內,企業的數字化主要集中在數據的搜集、傳輸、整理和存儲等環節,數據的價值沒有得到進一步的挖掘。而以ChatGPT為代表的生成式AI的出現,像是為數字經濟註入了一針強心劑,讓數據從簡單代碼逐步走向可以輔助個人、企業,甚至是政府決策,甚至替代決策。

今年兩會上《政府工作報告》也指出,深化大數據、人工智能等研發應用,開展「人工智能+」行動,打造具有國際競爭力的數字產業集群。從九年前兩會政府工作報告首次提出「互聯網+」,到今年兩會新提「人工智能+」,數字力量為中國帶來了一輪又一輪的深層次、顛覆性經濟與社會變革。

隨著AI技術的快速發展,也讓底層數字基礎設施發生了翻天覆地的變化。隨之而來的算力需求,也讓市場呈現出爆發式的增長,據國際數據公司(IDC)發布的報告顯示,全球算力投資額將在未來五年內以每年16.5%的復合增長率增長。中國作為全球最大的算力市場之一,算力投資額占比已超過全球總投資額的1/3。

數據顯示,截至2023年6月底,中國在用數據中心機架總規模超過760萬標準機架,算力總規模達到197EFLOPS,位居全球第二。算力總規模近五年年均增速近30%,存力總規模超過1080EB。

在這個過程中,智能算力已經逐步取代通用算力,成為當下的主流算力。國家層面,工信部聯合有關部門印發《算力基礎設施高質量發展行動計劃》中明確指出,到2025年,計算力方面,我國算力規模超過300EFlops,智能算力占比達到35%.....

據預測,到2030年人類將進入YB數據時代,通用算力將增長10倍,人工智能算力將增長500倍。

顯然,隨著以AI為代表的新一代數字技術快速的發展,數據已經成為關鍵生產要素,而「計算力就是生產力」也已成為業界共識。算力設施已經成為釋放數據價值的關鍵,在這個過程中,如何確保數據的安全,成為關鍵。

放眼目前國內在建或剛建成的數據中心,絕大多數以能支持智算項目的智算中心為主,而一些老舊機房為了可以滿足智算項目,也在積極的從配電、機房空間、布線等環節入手,著手進行改造。

AI算力的「心臟」——AI服務器

如果說把智算中心比作一個人,那麽「他」的心臟一定是服務器,無論是土建、配電,還是供冷、布線,最終服務的對象都是服務器。而服務器也是AI算力的重要載體,是整個數據中心對外輸送算力的核心。

根據行業分析機構TrendForce集邦咨詢的預測,全球AI服務器市場將在2024年迎來顯著增長,預計總量將超過160萬臺,年增長率達到40%。

而AI技術的發展,也對AI服務器提出了更多、更高的要求。首先,AI服務器需要具備高性能計算的能力,以支持復雜的AI算法和大規模數據集的訓練,通常涉及到高性能CPU、GPU和ASIC等計算單元的配備。

其次,需要具備大容量的存儲系統。AI模型和數據集通常都非常龐大,因此需要AI服務器配備大容量的存儲系統,包括高速的固態硬盤(SSD)或硬盤陣列,以提供高效的數據讀寫性能。

再次,為了適應快速發展的需求,目前市面上常見的AI服務器均采用模塊化的設計。采用模塊化設計後,服務器允許根據需求靈活擴展計算、存儲和網絡等模塊。這種設計可以提高服務器的可擴展性和可維護性,同時還能滿足用戶未來業務發展。

除此之外,在數據已經成為企業,乃至國家重要資產的背景下,數據安全受到了格外的重視,服務器如何通過軟硬件協同,確保安全,自然也成為了一款AI服務器產品好壞與否的關鍵。這也自然對服務器整個產業鏈提出了更高的要求。

鈦媒體APP註意到,在本屆數字中國建設峰會期間,浪潮計算機發布全新的基於國內主流技術路線的AI服務器產品——NF5468H7。浪潮計算機相關負責人告訴鈦媒體APP, NF5468H7是面向深度學習、元宇宙、AIGC、科學計算等多個復雜應用場景使用的高性能創新技術AI服務器。「該款服務器是一款具備多元算力性能、彈性架構擴展、多場景靈活適用的全新一代人工智能服務器。」該名負責人指出,「同時,該款服務器可以靈活適配各品牌最新AI加速卡和IB/RoCE網卡、智能網卡。」

據了解, NF5468H7在4U空間內,最大支持8張雙寬GPU、5個標準PCIe插槽,1個OCP網絡插槽;3種PCIe拓撲靈活切換,滿足HPC以及不同計算量的AI訓推應用場景需求。該產品在2024年1月經相關專家認定產品技術達到先進水平,證明了產品在創新力上的領先性。

而AI服務器僅是浪潮計算機在賦能可靠算力發展過程中的一個具象化的表現。此次數字中國建設峰會上,浪潮計算機的展區還帶來其多元化的服務器產品。據了解,這些產品已經被廣泛應用在數字中國建設的各個層面,並為數字中國建設提供了安全可靠的底層支撐。

以數字智慧電網為例,在建設數字智慧電網過程中,浪潮計算機以智能算力為支撐,通過人工智能、大數據等技術的應用,推動數字電網向智慧電網升級,實現智能化的電網監控與管理,實時監測電網運行狀態、精準預測負荷需求,智能遠程監測、缺陷與故障實時預警和精確定位,促進新能源安全高效並網、海量資源精準調控以及全鏈條能耗降低,構建電力系統新形態。

而在智慧政務方面,同樣以浪潮計算機為例,以多元化服務器和電腦等核心信息化產品及基於一雲多芯的政務雲解決方案為依托,通過建設數字底座新型基礎設施,促進數字政府實現數據融通和智慧服務,提升政府履職效能、提高政府服務水平。

好的應用與好的「硬件」同樣重要,回看當下AI服務器市場發展,加碼AI服務器的顯然不止浪潮計算機一家。超雲在近日全新推出了R8424 G13這款基於英特爾第四代至強可擴展處理器系列設計的高性能GPU服務器。據了解,該款服務器主要應用場景涵蓋氣候和天氣建模、CFD、CAE、計算物理、生物化學模擬、數據分析、衛星成像以及計算金融學等科學計算領域;.除此之外,新華三、聯想、超聚變等一眾廠商也紛紛推出全新的AI服務器,瞄準AI這塊「大蛋糕」。

服務器之外,AI技術正在向C端滲透

如果說AI對於服務器市場的影響是普通人感受不到的,那麽AI對終端電子產品的影響,則正在顛覆終端消費者對於電子產品的認知。AIPC的出現很可能成為電腦行業的「IPhone時刻」。

2023年9月,英特爾率先提出了AIPC概念,而這一概念隨之在過年的不到一年的時間內快速發酵,日前,微軟推出了內置GPT-4o的全新AI PC,AIPC概念再度引爆市場。

3月初,蘋果發布AI PC MacBook Air。3月18日,榮耀發布公司首款AI PC MagicBook Pro 16,緊接著,AMD董事會主席及CEO蘇姿豐宣布AMD銳龍8040系列AI PC處理器已經實現出貨。3月22日,微軟宣布推出Surface AI PC......

AIPC瞬間成為各大科技公司爭先恐後布局的重點產品。在本次數字中國建設峰會上,浪潮計算機也帶來了全新的AIPC產品。

據鈦媒體APP了解,浪潮計算機AIPC由浪潮計算機聯合浪潮科學研究院共同推出,是一款具有強大算力、性能強勁的PC產品。該款產品支持運行本地大模型,生成高質量AIGC內容。辦公寫作,一鍵成稿校對,提高辦公效能及生產力,有效保障個人數據及隱私安全。

與此同時,產品內嵌了AI智能助手,支持智能增強檢索及AI會議系統等功能,打造個人專屬知識庫,並提供AI會議系統支持語音實時轉寫,智能轉譯,自動生成會議紀要及待辦。

浪潮計算機相關負責人告訴鈦媒體APP,此次推出的AIPC產品支持ARM或C86 8核處理器搭配國內高性能獨立顯卡,支持安裝獨立AI加速卡,最高可提供達128TOPSAI算力,並擁有高頻內存,高速SSD,支持雙通道 DDR5高速內存,采用大容量PCIE M.2 SSD。

除了浪潮計算機在AIPC方面的布局外,鈦媒體APP註意到,諸如華碩、聯想等傳統個人PC廠商也在近期紛紛推出AIPC相關產品。

從目前推出的AIPC產品應用場景上看,主要聚焦在智能化辦公、智慧教育兩大領域。

同樣以浪潮計算機為例,浪潮計算機負責人告訴鈦媒體APP,目前,浪潮計算機就攜手了國內某學院,以浪潮電腦為基礎部署了雲桌面軟件,創造了彈性、開放、易用的基礎環境,並結合計算機網絡、物聯網等技術,利用門禁控製器、紅外傳感器等感知設備實現了對教室內環境的感知,自動啟動或管理教室內部設備,打造了智慧教學樣板間。

而隨著這一輪AI技術的不斷發展,AI對於底層硬件的影響已經不僅僅局限於B端的產品上,AI正在以普惠的方式,逐步滲透到人類的生活生產中。---(鈦媒體/作者:張申宇*編輯:蓋虹達)