一張“啞火”的AI禁令
圍繞AI算力展開的政治博弈,一直在此起彼伏地發生著。
不過,事情也在悄然發生變化。
我們發現,那種“美國一禁運,中國就破防”的緊張情緒,已經減弱了很多。
前不久,美國商務部出了一份《采取額外措施應對與重大惡意網絡行爲相關的國家緊急狀態》提案,提出:禁止中國公司使用美國的雲計算資源來訓練AI模型。
這相當于AI芯片禁運的“補丁”。美國商務部長吉娜·雷蒙多在采訪時提到,美國的雲數據中心也大量使用AI芯片,而美國對芯片實施了出口管制,也必須考慮關閉這條路徑。
這一次,中國AI業內和大衆的情緒都還算穩定。
一方面表現在語言上。AI行業群內對這個提案的討論都很少,並不是諱莫如深,而是一種“早已料到”的淡定,倒是對國産算力替代、通用算力訓練AI等話題的關注度,不斷提升。
另一方面表現在行動上。各個AI企業、大模型公司,也並沒有急著“下美國雲”,或是緊急研究什麽避險方案。要知道之前英偉達H100和A100芯片被禁運時,産業各方都迅速反應,英偉達隨即推出定制版,國內大廠瘋搶囤貨,緊張感拉滿。
同樣是對AI算力的限制,爲什麽美國雲基礎設施,不再讓我們 “汗流浃背”了?從一張“啞火”的AI禁令背後,我們可以讀到很多。
新AI禁令,影響到底有多大?
先說結論:沒多大。
可能有人要急了,AI算力供需本就緊張,芯片不讓賣、雲也不給用,你還說沒事,心也太大了吧?
知道你很急,但你先別急。
第一,美國雲廠商在國內公有雲市場的份額很小,並且越來越小。
按美國商務部長的說法,被要求審核中國AI公司身份的美國基礎設施即服務 (IaaS) 提供商,主要包括亞馬遜AWS、微軟Azure、英偉達算力雲等。
微軟Azure、英偉達算力雲的中國市場份額,小到無法擁有姓名。IDC近日發布的《中國公有雲服務市場(2023年第三季度)跟蹤》報告顯示,2023年第三季度,中國公有雲(IaaS+PaaS)市場中,唯一占據一席之地的美國雲服務商是AWS,其市場份額也只有8.2%。並且相比2022年第三季度的8.5%,占比還有所下降。所以說,受該禁令影響的中國用戶數量並不多。
第二,美國雲廠商的中國用戶,使用量也都不大。
目前使用AWS、azure等美國雲數據中心的中國用戶,以外企的中國機構、出海中企、混合部署等需求爲主。艾瑞咨詢曾在《2021年中國基礎雲服務行業數據報告》中,首次增加了“出海業務”,亞馬遜AWS的市場排名立馬從第五挺進前三,說明其國內業務的“出海”比例極高。
外企在中國、中企走出去,是一個目前還不算主流的邊緣市場。而混合多雲部署的中國政企客戶,“不把雞蛋放在同一個籃子裏”,目的是分散風險,美國廠商的雲本身就是“備胎”,當然也不會將太多核心業務放在上面。
(艾瑞咨詢:2021年中國基礎雲服務行業數據報告)
第三,美國雲的AI黏性有限,中國主流的AI大模型及應用都在國內雲上。
有人會擔心,微軟雲azure支持OpenAI那麽領先的大模型,還有各種AI套件,肯定會吸引一部分國內用戶,通過雲訪問調用其AI能力吧?
一方面,OpenAI的大模型並不向大陸開放,IaaS層面的計算資源差異性不大,海外雲的吸引力也就大打折扣。另外,要讓AI模型跑得“多快好省”,不僅要有萬卡集群的硬實力,還需要軟硬協同優化、異構硬件兼容、開發工具鏈、社區生態,甚至商業資源、聯合開發等各種支持,國內雲廠商無疑更具本土化優勢,也成爲中國産學研用機構做AI的首選。
政企客戶和國計民生關鍵行業,自主可控已經成爲共識,紛紛選擇成爲國內雲廠商的客戶。2023百度雲智大會的一組數據顯示,千帆大模型平台上的月活企業數,已近萬家。
具備底層技術的中國AI大模型企業,更是從一開始,就將大模型部署在國內的雲上。2023年7月,訊飛星火就與華爲昇騰AI聯合,讓國産大模型架構在自主創新的軟硬件基礎之上,打造國産通用智能新底座。最新升級的訊飛星火認知大模型 V3.5,也強調自己是“國産算力原生模型”。
所以說,美國雲服務商在中國大陸的市場份額少,業務體量小,AI黏性又不夠強,因此對中國AI的影響有限,從而導致了此次禁令的“啞火”。
不是N卡用不起,而是國産算力更有性價比
這樣會不會出現一種情況,像20世紀熊貓EDA那樣,美國一看禁了個寂寞,幹脆放開來搶市場,國內用戶就流向了海外雲平台?
大概率也是不會出現的。
因爲國産算力並不只有安全自主可控這一個“賣點”,性價比優勢對中國AI産業界也很有吸引力,而這是英偉達AI芯片很難取代的。
坦率地說,我們的芯片制造工藝確實還做不出頂級的強大芯片,性能上不比N卡強,爲什麽國産算力還能有高性價比呢?
高性價比的背後,是國內雲廠商從三個角度的努力:
一是自建多樣化的國産算力平台。
除了英偉達的高端GPU,國産AI芯片、通用CPU算力、超算中心算力,也都能處理AI專項任務,而且成本上更具優勢。目前,雲廠商都在強化對國産硬件的兼容性,積極構建國産算力體系。
具體來說,華爲的AI芯片制造技術已經開始取得突破,昇騰系列穩定出貨,在某些性能上甚至超越了英偉達的中國特供版。海光、華爲、飛騰等自主設計開發的CPU/DCU芯片,既可以確保自主可控,也容易規模化量産。已經建好的超算中心,也可以爲AI提供算力服務。
多樣化、異構的國産算力體系,可以緩解AI和雲計算對高端GPU的緊缺。
記得一位中科院的科學家跟我說過:等到智算、超算沒有分界線的那一天,中國AI可能就真的崛起了。而國産算力從硬件走上雲端,轉變爲AI雲服務,正在加速這一天的到來。
二是算力網絡的一體化調度。
OpenAI訓練ChatGPT等采用的是“集中式”算力,即萬卡集群。中國沒有那麽多先進的卡怎麽辦?用“分布式”算力,把各個地區的算力網互聯互通,一樣可以給AI企業提供算力服務。
舉個例子,北京、上海、廣州、武漢等地都有2000塊卡的算力中心,把它們通過專網聯合起來,就能組建起一萬塊、兩萬塊卡的算力平台,代替一個萬卡集群,來做超大規模數據訓練。
“分布式”算力,就需要把分布在全國各地的智算中心、雲計算中心、超算中心給聯接起來。早在2020年,國家多部門就出台了《關于加快構建全國一體化大數據中心協同創新體系的指導意見》,建立橫跨東西的算力網絡與數據存算一體化節點,可以有效調節中國算力供需。通過統一算力調度平台,可以將數據源周圍的閑置算力資源調度起來,更高效地滿足AI産業各界的巨大需求。
三是技術創新的算力榨取。
當然,國産算力要在性能上達到頂級GPU的能力,確實有些爲難。所以,盡可能地榨取國産算力,讓其精准適配AI訓練推理等任務的需求,會讓資源利用率更高,成本效益更加顯著。
提升算效,發揮出每一張卡的價值,需要一系列創新技術的支持,軟硬件聯合優化,計算行業與AI行業的協作。雲廠商聯合基礎設施供應商、AI産研各方,積極開展技術創新,提升算力訓練效率。
比如,百度智能雲千帆平台,就通過分布式並行訓練策略和微秒級互聯能力,讓萬卡訓練集群的加速比達到95%,也就是發揮出了95%比例的機器的效能。
總結一下,讓中國AI發展不掣肘于芯片供應,國內雲廠商真的很努力。
今天再面對一紙“禁令”,中國AI也可以淡定地說一句:不是N卡用不起,而是國産算力更有性價比。
備戰是爲了不戰,中國AI的未來通道
如今,對于AI算力,或許我們可以暫時放下緊張情緒,對相關禁令松一口氣了。
必須強調一點,自主可控不是爲了全面替代。徹底脫離海外AI軟硬件的供應鏈,既不現實,也沒有經濟效益。
有句話說得好,要把槍放在談判桌上。
當我們有了自主的AI基礎設施,自己的AI軟硬件開發生態,不用擔心“美國一禁運,就沒有算力用”,對方沒有了“博弈”的籌碼,一通操作結果禁了個寂寞,自然也就沒有必要再繼續折騰了。如此,才有可能避免“擦槍走火”,讓算力供應維持一個比較平衡和穩定的外部環境。
所以說,備戰是爲了不戰。
當然,一波又一波的禁令也表明,圍繞AI這一關鍵領域的博弈只會愈演愈烈。昨天禁芯片,今天禁雲服務,明天禁什麽不知道,但禁令一定會“雖遲但到”。
這種局勢下,我們也要做好更多准備,才能在較量中獲得話語權。
雲計算作爲中國AI的戰略支柱,國內雲廠商想要接住“潑天的富貴”,接下來還有許多工作要做:
1.做好國內算力基礎設施與一體化算力網絡的有效應用。
比如AI芯片種類繁多,既有不同品類,也有不同版本,兼容難度非常大,AI企業想用到最合適的芯片,有較高的切換成本,雲平台對國産芯片的兼容性更強,能夠減少企業AI訓練的難度。再比如,算力網互聯以後,異構算力怎麽標識、怎麽調度、怎麽計費、通信協議怎麽解決、資源配置效率怎麽提升……這些問題都是需要持續解決的,也構成了國內雲廠商的機遇。
2.提供全棧AI能力和完善的遷移服務。
AI大模型的技術複雜性也帶來了采用、部署等方面的挑戰,雲廠商可以通過更友好、全面的AI能力和遷移能力,支持行業客戶與開發者,建立起自己的AI生態系統,收獲業務增長。
3.加強出海業務及服務能力。
前面提到,禁令的影響範圍,可能是AWS上一些外企在華、中企出海的業務。這也提醒我們,中國的雲服務商,不能故步自封,要積極出海,給中國企業在海外,搭建一條可信、可靠的通道,支撐它們海外業務的持續開展。目前,擁有全球化經驗和業務布局的華爲雲,已經加速了歐洲、中東等市場的腳步,給中企出海、外企入中一個“更好的選擇”。
莫聽穿林打葉聲,何妨吟嘯且徐行。這些技術、産品與解決方案,彙合成一條中國AI前進的雲端通道。讓我們可以看到禁令,從容以對。因爲AI基礎設施,中國已經做好了准備。---來源: 腦極體-