懂AI PC的人要先擁抱新世界了 | 模力時代
2024年第一個四分之一還沒過完,PC市場的最熱關鍵詞,已是非「AI」莫屬。
最新消息,繼聯想、榮耀之後,微軟的首款AI PC馬上也要來了。
據Windows Central爆料,微軟將于3月21日發布新款Surface Pro和Surface Laptop。
兩款新品圍繞人工智能打造:
硬件方面,Intel版本搭載號稱“AI CPU”的全新Intel Core Ultra,arm版本則用上了能把130億參數大模型塞進PC的高通骁龍X Elite。
軟件方面,兩款新品均將首批支持Windows 11的“下一代”AI體驗,包括一個內部名爲“AI Explorer”的全新AI功能。
消息人士稱,AI Explorer將會“使AI PC與非AI PC完全區分開來”,依靠自然語言交互,用戶就能在PC上完成一切。
(賈維斯內味兒,這不就來了嗎doge)
這還不算完,各種老牌PC玩家也都坐不住了,紛紛放出自家首款AI PC的消息。
由大模型技術風暴掀起的「模力時代」中,我們日常使用的生産工具正在加速變革。
這樣的趨勢,現在越發明朗。而終端産品的變革,也意味著,對于人們的日常工作生活而言,新一代的辦公、學習姿勢已經在醞釀之中。
△ChatGPT4生成
那麽,問題來了——對于普通打工人而言,産品概念花裏胡哨,但究竟怎樣的PC,才算是真正的AI PC?
PC可以怎樣AI?
終端側AI趨勢開始後,終端、芯片、應用廠商正在用一個個面向生成式AI的芯片逐步補全關于AI PC的定義。
最先勾勒出想象的是微軟。
去年9月,Colpilot正式進入Windows 11,成爲電腦系統的AI助手。
這徹底掀開PC上自然語言交互的序幕,更改設置、整理桌面、打開軟件都能通過聊天的方式實現。
聯想緊隨其後,推出首款AI PC,展示了大模型運行在本地後,給用戶帶來更加專屬化的體驗。
基于用戶個性化信息創建本地知識庫,量身定制完成一系列新任務。
比如基于電腦上的家庭照片和視頻,創作一段“智能剪輯”。
再或者是成爲更本地化的工作助手,幫助寫文檔、總結知識點、提升生産力。
與此同時,最關鍵的底層芯片也重大更新。
高通發布骁龍X Elite,就從底層角度給出了關于AI PC的一系列思考。
這塊4nm制程的CPU支持130億參數大模型的本地運行,70億參數模型可每秒生成30個token。
AI引擎算力可達75TOPS,AI處理速度可達競品的4.5倍。
CPU、GPU性能均是競品的2倍,相同峰值性能功耗比競品低68%。
除此之外,剛落幕不久的MWC 2024上,高通還展示了多模態大模型在PC本地運行的示例。
它能理解音頻並進行推理,可實現語音輸入的多輪對話。
這意味著,AI PC趨勢和多模態趨勢正在交彙融合,傳統PC的交互方式將發生更加徹底的變革。
透過廠商們的實際動作,一些關于AI PC的初步共識已逐漸清晰。
即AI PC應該成爲一個用戶專屬的個人助理,它具備強大的AI能力和底層計算能力,將人類從日常生活中常規的、重複性的、看似瑣碎的工作中解放出來,轉而從事更加具有創造性、求變的工作。
但問題是,現在的傳統PC如何才能走到這一步?哪些地方已經悄然發生改變?
技術趨勢給出了一定答案。
AI如何重塑PC?
面向生成式AI,PC要經曆的是一場全新計算架構的變革。從底層硬件到上層應用,都正在發生變化。
因爲生成式AI浮現出的典型場景,給計算連接等都提出新要求。
高通最新公布的《通過NPU和異構計算開啓終端側生成式AI》白皮書中總結,生成式AI用例可分爲三類:
按需型:由用戶出發,需要立即響應。比如在PC上生成會議摘要、開車時用語音查詢最近的加油站。
持續型:運行時間較長。比如用手機進行實時對話翻譯,PC上玩遊戲時逐幀運行超級分辨率。
泛在型:在後天持續運行。比如始終開啓的預測性AI助手。
這些情況都面臨兩大關鍵挑戰。
第一,考慮到終端的功耗和散熱問題,通用CPU和GPU難以滿足這些AI任務的計算需求。
第二,生成式AI應用還在不斷豐富,不能在功能完全固定的硬件上進行部署。
硬件方面,NPU和異構計算成爲應對挑戰的關鍵。
在終端側AI趨勢興起後,原本更常出現在手機芯片上的NPU,也開始在電腦芯片上發揮更加重要的作用。
NPU(Neural Processing Unit)專門爲加速神經網絡和AI任務而生,可以快速處理AI推理任務。它不易于編程,但能實現更高的峰值性能、能效和面積效率,從而運行機器學習所需的標量、向量和張量數學運算。
隨著AI趨勢演變,NPU的設計也發生了一系列變化。比如2015年時,NPU主要面向音頻和語音AI設計,用于簡單CNN並主要需要標量和向量數學運算。
後面隨著AI在拍照和視頻中的使用增多,以及Transformer、RNN、LSTM和高維度CNN等模型相繼出現,NPU又增加了張量加速器和卷積加速,可以降低內存帶寬占用和能耗。
發展到大模型時期,低時延、續航、內存、等因素共同要求下,NPU往往比GPU表現出更好的能效和性能,也使得NPU成爲生成式AI終端上不可或缺的部分。
舉例來看,骁龍X Elite上集成的Hexagon NPU算力達到45TOPS。
在不損失太多精度的情況下,Fast Stable Diffusion能夠在0.6秒內生成一張512×512分辨率的圖像。
但隨著生成式AI終端逐漸發展,端側運行的模型可能規模還將繼續擴大,多模態趨勢已經顯現,還有可能會搭載多個大模型。
僅靠NPU來支撐生成式AI任務,可能還不是最佳方案。
目前廠商們已經開始通過異構計算,讓不同處理器分別處理擅長的任務,也就是讓全部處理器都來支持生成式AI任務。這一直是高通堅持且擅長的賽道。
GPU不僅用于處理圖像任務,也能用于以高精度格式進行AI並行處理,支持FP32、FP16、INT8運算。
CPU則能用于計算量低、要求低時延的AI任務上,如高通Oryon CPU性能達競品的2倍,功耗還降低了三分之二。
處理器之間的相互配合,可以進一步釋放AI引擎性能,超越單NPU效果。
與此同時,軟件層面也受到AI影響發生改變。
一方面,生成式AI終端需要軟硬結合才能更充分釋放性能;另一方面,開發者也需要適宜當下的工具,能夠更快速將大模型加入到應用中。
在MWC 2024上,高通宣布推出的AI Hub正是這樣一個平台。
它是一個全面的模型優化庫,爲開發者提供超過75個主流模型,如Stable Diffusion、ControlNet、Baichuan-7B等。這些模型全部經過優化,可以充分利用高通AI引擎內所有核心的硬件加速能力,實現4倍推理速度提升。開發者能快速將大模型無縫集成到應用程序中,縮短産品面市時間。
同時這些優化後的模型也同步上線到GitHub、Hugging Face。開發者可在搭載高通和骁龍平台的雲托管終端上自行運行模型。
更早推出的高通AI Stack可全棧支持主流AI框架(如TensorFlow、PyTorch、ONNX和Keras)和runtime。集成高通神經網絡SDK,面向Android、Linux和Windows不同版本。
此外還提供一系列量化、壓縮開發工具,能夠在盡量不降低模型精確度同時壓縮模型。一些生成式AI模型由此可以量化至INT4。
總之,從底層硬件到上層軟件,都在以生成式AI爲中心進行快速變革。
巨頭們腳步一致,紛紛加速All in AI,也讓生成式AI帶來的變革更加迷人。
AI變革究竟會如何影響每一個人的生活?
AI PC展現出的演進過程,已經給大家做了一些小劇透。
AI PC通往何處?
細數起來,AI PC從概念興起到初步産品落地,剛剛過去半年的時間。
高通産品管理高級副總裁兼AI負責人Ziad Asghar將其類比爲“人們剛剛能夠實現手機上網”的階段:數十億人都能夠通過手機連接到網絡,奠定了此後移動互聯網應用大爆發的格局。
我想如果我們能夠在終端側實現AI的發展,就可以把生成式AI的能力和優勢充分發揮出來,打破所有的界限,利用生成式AI的能力讓我們在生活、工作、娛樂、醫療等各個方面都獲得更好的體驗。
換言之,AI重構PC,現在正是打地基的階段。
從上述各大廠商的動作之中,可以梳理出幾個關鍵的環節:
雲端大模型能力向終端側的遷移
爲生成式AI打造的芯片+AI開發平台
基于AI+5G技術的設備互聯
前兩者不再做過多贅述,設備互聯,則關系到生成式AI的發展從第一階段走向第二階段的實質:
數據在哪裏,AI推理就在哪裏進行。
短期來看,終端生成式AI基礎能力的構建,能在手機、PC這樣的生産力終端上率先帶來應用的爆發,提高生産效率、帶來新的創新機會——
對于普通用戶,人機交互方式徹底變革,自然語言操作一切,帶來的是更高的終端使用效率。
對于開發者而言,新一輪的AI原生應用爆發機遇,已經是現在進行時。AI搜索應用Perplexity,剛剛被曝估值將破10億美元,跻身獨角獸行列。
而對于終端廠商而言,從底層芯片到操作系統的變革,也將帶來重塑市場格局的機會。
從更長期來看,更重大的影響則是,AI PC、AI手機的背後,真正的私人AI助理將會出現:用戶能夠在本地打造專屬的Agent,而通過終端設備互聯,AI Agent將可以滲透到生活的方方面面。
工業革命的核心,是生産力的突破和生産方式的變革。AI掀起的技術風暴,概莫能外。
而就像從紙質辦公到網絡辦公,處在當下的我們還無法窺見未來的全貌,但可以預見的是,以人爲中心,AI將自然流轉于手機、PC、智能車、AR/VR,乃至全新的AI硬件之上,構建起真正的萬物互聯。
身處這樣的時代,對于直面風暴的技術廠商們而言,如何跟上趨勢,已有高通這樣的先行者給出參考。
而對于我們每一個普通而言,更重要的是,認真思考如何擁抱新變革的時間點,已經到來。
畢竟先擁抱新趨勢的人,先享受世界。---[魚羊 明敏 發自 : 凹非寺*量子位 : 公衆號 QbitAI/來源: 量子位]