01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

AI「芯」突圍:英特爾Gaudi 3硬剛英偉達搶市場,國產芯片細分賽道謀變

2024041514:25

2024年,AI「芯事」迎來新節點。

近日,英特爾發布了新一代AI加速器Gaudi 3。英特爾聲稱,新款Gaudi 3芯片與英偉達H100芯片相比,推理能力平均提高50%,能效平均提高40%,運行人工智能模型的速度是H100的1.5倍。

據Intel Gaudi 3白皮書信息顯示,這款產品將與英偉達最新的H200大致相當,在某些領域甚至表現更好。

除了芯片本身的「較勁」,英特爾還計劃主動開放生態,試圖打破英偉達的高墻。此前,英特爾高管接受采訪時曾表示,英特爾「開放」的人工智能堆棧是與競爭對手英偉達的一大區別。

在Gaudi 3發布的幾天後,市場就有消息傳出,英特爾的Gaudi 3已經準備好了提供給中國市場的版本,將於6月份推出。時代周報就此消息向英特爾核實,不過英特爾方面沒有具體回應。

相比國外芯片廠商「狂卷」,國內芯片廠商也正積極破局。

時代周報記者近日從CITE 2024((第十二屆中國電子信息博覽會)了解到,目前我國芯片供應仍然相對緊張。雖然國內已有企業推出智能算力芯片,在電商智能搜索、智慧工業、智能駕駛等部分推理場景已開展應用落地,在大模型訓練應用尚處起步階段。國內智能算力芯片綜合性能較英偉達產品存在一定差距,但個別產品在自然語言、圖像處理等算法上能力較強。

英特爾以「開放」突圍

英特爾自2019年以來一直在製造Gaudi系列芯片,不過步伐始終比英偉達慢了兩年。

2019年7月,英特爾推出的Gaudi 1加速器,在彼時規模還很小的AI市場中,對標英偉達2017年推出的Volta V100。隨後,英特爾花20億美金收購Habana Labs,並於2022年5月發布Gaudi 2。Gaudi 2采用7nm製程打造,英特爾宣稱其工作負載量幾乎是英偉達A100 80GB處理器的2倍,而A100 是英偉達在2020年發布的一款GPU平臺。

英特爾近日推出的新一代Gaudi 3則采用了臺積電(TSM.US)5nm工藝,對比上一代帶來了4倍的BF16 AI計算能力提升,以及1.5倍的內存帶寬提升。

據英特爾介紹,Gaudi 3對比H100推理能力平均提高50%,能效平均提高40%,運行人工智能模型的速度是H100的1.5倍。英特爾表示,這款產品將與英偉達最新的H200大致相當,在某些領域甚至表現更好。

盡管英特爾未透露Gaudi 3的定價信息,但相對於H100,英特爾表示Gaudi 3將提供更「有吸引力的價格」。該產品將於2024年第二季度面向OEM廠商出貨。



英特爾此舉被視為為搶占AI芯片市場份額而硬剛英偉達,因為英偉達剛一個月前宣布了GPU新核彈B200和超級芯片GB200。

但大家似乎只看到英特爾在參數上的「野心」,而忽略了藏於背後的開放策略。

當天和Gaudi 3同時發布的,還有英特爾面向開放的、可擴展的AI系統的戰略,以及聯合Anyscale、Articul8、DataStax等多家企業宣布創建的開放平臺。即使是Gaudi 3,英特爾也強調其「開放性」,Gaudi 3提供開放的、基於社區的軟件和行業標準以太網網絡,允許企業靈活地從單個節點擴展到擁有數千個節點的集群、超級集群和超大集群,支持大規模的推理、微調和訓練。

過去十幾年,基於x86架構的處理器在數據中心是絕對王者,而英特爾對X86架構有著絕對的控製。這種專有的處理器架構,最初由英特爾開發,用於早期的個人電腦(PC)。由於英特爾在PC市場的主導地位,X86架構成為了事實上的標準。英特爾一直保持對X86架構的控製,並且通過授權給其他公司生產和銷售X86處理器來確保其生態系統的穩定和盈利。

近年來,隨著市場發展和與其他處理器架構(如ARM、RISC-V)競爭加劇,英特爾已經開始采取更加開放和合作的策略。

從AI市場來看,目前英偉達在芯片市場占據著絕對優勢,英特爾希望用產品撬走份額並不容易。富國銀行統計顯示,目前英偉達在數據中心AI市場擁有98%的市場份額,而AMD公司的市場份額僅有1.2%,英特爾則只有不到1%。而美國銀行預計,未來Gaudi 3可能也僅將占據不到1%的AI加速器市場份額。

今年3月,英特爾全球渠道主管Trevor Vickers在接受CRN的獨家采訪時,談到英特爾「開放」的人工智能堆棧是與競爭對手英偉達的一大區別,這也是讓英特爾的CPU在快速增長的推理領域獲得發展的機會。

「對我們來說,關鍵在於我們如何創建這些生態系統,使它們具有韌性、安全性、高性能並且是開放的,這是我們與合作夥伴能提供的非常重要的部分。」Trevor Vickers表示,英特爾希望擁有一個開放的AI堆棧,希望在將產品推向市場時秉持「一次編寫,隨處交付」的精神。

這種「一次編寫,隨處交付」指的是英特爾的oneAPI開放標準,該標準允許開發人員對不同類型的處理器使用單一的編程模型,無論是英特爾CPU、還是由英特爾或競爭對手製造的GPU,都與英偉達產品的專有性形成鮮明對比,目前英偉達的CUDA平臺僅支持Nvidia設計的處理器。

或推出中國特供版?

英特爾與英偉達的在AI領域的博弈正深入腹地,中國則是其AI芯片應用的「主戰場」之一。

在英特爾發布Gaudi3幾天後,市場上就流傳出消息稱英特爾或於今年下半年推出兩款專供中國市場的Gaudi 3 AI加速器芯片,只不過性能將大打折扣。時代周報記者就此向英特爾方面詢問,但截至發稿並未得到具體回應。



去年7月,英特爾就發布了面向中國市場的Gaudi2。相比國際版Gaudi2,面向中國市場推出的加速卡在性能上差別不大,而集成以太網RDMA端口數量從24個端口減到21個,以符合美國芯片出口管製規定。

無獨有偶,去年10月,英偉達也推出了三款基於其AI芯片H100的「降級版」芯片:H20、L20和L2,並計劃在今年二季度量產。但據參考消息網,由於「中國特供版」AI芯片樣品算力不足,相關公司已暗示英偉達,今年訂購的英偉達芯片數量將遠少於原計劃。

近日,時代周報記者在CITE 2024上走訪,從部分芯片代理商口中得知,目前他們手上銷量較好的產品是英特爾和AMD的CPU,英偉達的產品只能賣中國特供版本。

「不過,也有不少人之前囤了很多H100芯片再轉手賣,價格會相對貴一點。」一位代理商表示。

時代周報記者從超算行業相關人士了解到,有不少人手頭囤積幾十到上百片H100現貨,以尋求在流通中獲得價差。根據一位經銷商報價,目前100多片H100芯片的大概價格在280多萬美元左右。

中國信息通信研究院南方分院院長助理張昊在CITE 2024上表示,目前我國智能算力全球占比超30%,主要依賴美國英偉達GPU芯片,國產自主算力份額僅為5%,國內TensorfiowPyTorch、Caffe等美國AI框架使用率超過90%。

不過,張昊同時提到,當前國內已有企業推出智能算力芯片,在電商智能搜索、智慧工業、智能駕駛等部分推理場景已開展應用落地,在大模型訓練應用尚處起步階段。國內智能算力芯片綜合性能較英偉達產品存在一定差距,但個別產品在自然語言、圖像處理等算法上能力較強。

從性能來看,國產GPU在訓練方面的性能是英偉達A100的50%,和英偉達H100存在兩代以上差距;推理方面,與英偉達A10、T4性能接近,具備替代潛力。

從應用上來看,目前國內如昇騰、寒武紀、天數智芯主流芯片廠商已完成對主流大模型的適配。

「國產芯片加速與國內外大模型適配,具備10億參數大模型預訓練+微調,百億參數大模型推理的能力。隨著大模型種類收斂,以及大模型推理部署普及,國產GPU芯片組建的算力整機和集群有望在大模型調優、推理應用方面尋求市場開拓機遇。」張昊表示。---[郭美婷/來源:時代周報]