01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

端側大模型成焦點,智能手機進入AI“芯戰”時代 | 2023·大複盤

2023113013:11


當“生成式人工智能”成爲行業熱詞,在關注各類新興應用的同時,作爲提供應用底層支撐的“算力”也開始成爲關注的焦點之一。

對于傳統的高算力終端而言,通過增加額外的GPU硬件即可填補大模型訓練與AI生成所需的“算力鴻溝”,但像移動智能終端,受限于集成度、功耗限制等方面,想要擺脫聯網需求,實現端側部署生成式人工智能則具備更高的難度。

旗艦芯片AI領域率先發力,中端布局路徑産生差異

近兩個月,聯發科與高通先後發布了新一代旗艦級SoC芯片,兩者不約而同地提到了端側部署AI能力的提升。

以聯發科爲例,此前發布的天玑9300芯片內部集成聯發科第七代AI處理器APU 790,爲生成式AI而設計,整數運算和浮點運算的性能是前一代的2倍,功耗降低了45%。APU 790內置了硬件級的生成式AI引擎,可實現更加高速且安全的邊緣AI計算,深度適配Transformer模型進行子加速。



根據官方公布的數據,其處理速度是上一代的8倍,1秒內可生成圖片,同時,基于億級參數大語言模型特性,聯發科開發了混合精度 INT4 量化技術,結合內存硬件壓縮技術NeuroPilot Compression,可以更高效地利用內存帶寬,減少AI大模型對終端內存的占用,支持終端運行最高可達330億參數的AI大語言模型。

新一代智能手機芯片的發布,讓生成式人工智能獲得了硬件端的支持,不過搭載旗艦級SoC芯片的産品,市場定位基本也都局限在高端市場。根據IDC的數據,2023年第三季度,國內智能手機高端市場(3500元以上)的出貨占比爲33%。

換句話說,即便所有高端手機都開始支持端側生成式AI,在用戶層面也僅僅做到了每10個人中3個人有機會接觸到該功能。而定位更低的中端機市場,則暫時無法享受到大模型帶來的體驗升級,要知道,2500~3499元區間的手機銷量市場占比也達到了19%,並且處于不斷增長的趨勢當中。

如何擴大應用落地範圍,讓生成式人工智能不止是高端産品的“綁定産物”,是擺在各個終端廠商、上遊芯片供應商面前的首要問題。高通面向下一代中高端産品推出的第三代骁龍7,並沒有提及AI功能上的進步,主要提升依然是面向傳統使用場景的CPU、GPU性能以及能耗。



反觀聯發科,從天玑8000系列發布開始,在旗艦機之外的中、高端機型已經成爲了其加速移動芯片市場滲透率的“基本盤”,芯片的疊代速度更快,同時也加深了與終端手機品牌的合作。最新發布的天玑8300,也在同級産品中率先支持生成式AI,至高支持100億參數AI大語言模型。

該芯片集成聯發科 AI 處理器 APU 780,搭載生成式AI引擎,整數運算和浮點運算的性能是上一代的 2 倍,支持Transformer算子加速和混合精度INT4量化技術,AI綜合性能是上一代的3.3倍,可流暢運行終端側生成式AI的創新應用。

據聯發科無線通信事業部副總經理李彥輯透露,小米成爲首個借助其芯片能力實現端側生成式AI應用的手機廠商。

而小米集團總裁、Redmi品牌總經理盧偉冰則表示:“Redmi手機將會全球首發搭載天玑8300-Ultra芯片,該機在性能調度、系統應用和硬件底層能力開發方面,均會應用到新一代人功智能技術。”剛剛發布的Redmi K70E就是盧偉冰所說的首款支持端側生成式人工智能的手機産品。

從雲側到端側,移動大模型時代可以期待什麽?

雖然産品有了、應用也有了,但是提到大模型這項技術,似乎距離普通用戶還是很遠,究其原因就在于具體場景落地的匮乏,對于大衆消費者而言,根本感知不到大模型帶來的體驗差異。



值得慶幸的是,手機端的大模型應用正在加速普及,目前,包括華爲、小米、vivo等手機廠商都已經將大模型手機端的應用提上了日程,其中諸如語音助手與大模型的結合很多都已經到了內測甚至公測階段。

一位業內人士告訴钛媒體App:“大模型的加入可以讓智能語音助手跳出既有的算法‘機械問答’模式,對用戶指令的理解能力以及解決問題的能力都將增強,而這也只是第一步而已,下一步在端側生成式人智能落地後,像目前還屬于小衆技能的‘圖生文’‘文生圖’‘圖生圖’等進階應用,都有望在手機端實現,從而讓語音助手開始顯現出創造力。”

從長遠來看,大模型與端側生成式人工智能,的確有可能爲智能手機等終端硬件帶來更多或有趣、或實用的玩法。但钛媒體App在體驗了現階段手機端大模型應用後,只能說是“未來可期”而非“即刻革新”。

毫不客氣的說,當前手機內的大模型應用更多只是個噱頭而已,能夠感知到的“智能升級”非常有限,雖然語音助手能聽懂、回答的問題更多了,甚至可以具備一些簡答的前後聯系的邏輯思考,但與賽道內領先的Chat GPT仍有很大差距。

如果從AI繪圖應用來說,移動端面臨的挑戰也不少,像算力層面,目前業界主流的Stable Diffusion經過實測,最起碼需要RTX 3070以上級別的顯卡才能獲得比較流暢的應用體驗,同時其上手門檻也並不低,因爲AI繪畫往往需要對調用學習模型進行選擇,同時在繪畫中不斷提出新要求並對畫面進行調整,才能最終獲得一張質量還不錯的圖片。

Stable Diffusion這樣從AI繪圖應用興起就開始不斷改良的工具尚且如此,移動端的部署就會是更大的問題,如果只是通過文字描述可以生成圖片而已,那對于普通消費者來說,最多是上手嘗鮮一下,新鮮勁兒一過,立馬就變成了冷門技能,大模型應用就會走上當年智能語音助手一樣的老路,爆火之後市場便慢慢冷卻下來。



因此,端側大模型應用,也需要找到高頻場景進行適配,李彥輯認爲,“性能調度”將是一個很好的落腳點。“大模型不光可以學習傳統的文字、圖片資料,它也可以去學習用戶習慣,進而具備應用場景的自適應切換能力,”他提到。

具體來說,就是擺脫傳統的固定算法調度邏輯,讓AI更多地參與其中,比如用戶日常使用手機的時候,其處理社交信息、遊戲、刷短視頻時,對手機性能的需求都是不同的,過去手機系統往往是依靠應用來做反向適配,打遊戲調用高頻率大核心提高性能、文字聊天和待機使用小核心保持續航,這種調度能力是非常固化的。

智能手機具備端側AI能力後,就能將性能調度這件事變得更加主動,可以根據當前的場景需求進行實時優化,而非照本宣科的進行軟件和策略層面的適配。

钛媒體分析認爲,與聊天、AI繪圖等看似創新的應用體驗相比,能夠對既有的高頻場景進行精准賦能,才是端側大模型短期內能夠創造體驗價值的關鍵所在,無論是影像、性能表現上的優化亦或是對屏幕、揚聲器等硬件的實時智能調節,都是更能帶給用戶體驗感知升級的維度。

假設有一天,通過端側大模型結合用戶習慣、應用感知得到的數據進行學習,利用對軟硬件層面的綜合調度,讓智能手機的續航可以再提升20%甚至50%,誰還會說它只是個“噱頭”呢?---(钛媒體A/作者 : 鄧劍雲* 編輯 : 鍾毅)