大模型端側部署,我們來聊點不一樣的
從去年下半年開始,幾乎所有硬件廠商都達成了一項默契:抱緊AI。
手機廠商認爲這是繼功能機和智能機後的“第三次變革”;PC廠商則要更加興奮,因爲他們所在的行業,過去十余年間都未曾感受過技術變革帶來的紅利。在一票大語言模型的帶動下,“端側AI”開始反複被提及,盡管這個概念誕生還不滿一年。
在手機和PC廠商的敘事中,端側AI不僅能夠提升日常使用及辦公效率,還是隱私保護和數據安全的最優解,甚至有廠商指出,端側AI可以讓每個用戶擁有屬于自己的“個人大模型”。
暫且不說這些理念是否存在“先射箭子後畫靶子 ”之嫌,一個需要被前置討論的問題是:大模型如何在端側完成部署?
以手機端爲例,目前發布且有實際演示的模型中,10億參數量Stable Diffusion已經可以在搭載骁龍芯片的手機上運行,但再大一些的模型,比如讓手機廠商們心心念念的Llama 2,其130億參數規模跑在手機端就非常吃力,這還是在不考慮功耗問題的前提下。
也就是說,目前的大模型,有相當一部分根本無法打破端側産品在硬件上的掣肘,畢竟雲端算力可以通過增加機櫃和GPU的方式提高,但手機和PC顯然不具備這樣的條件。
針對這個問題,3月31日,虎嗅科技組主辦的“2024 AI內參會”上,邀請到了面壁智能CTO曾國洋,極客邦科技副總裁、TGO鲲鵬會總經理楊攀針對端側AI和AGI行業的技術實踐及應用場景展開了討論。
* 以小博大,未嘗不可
今年2月,面壁智能發布了20億參數的開源端側模型MiniCPM,在多個主流評測榜單中,該模型中英文分均超過Mistral-7B開源模型,甚至優于Llama 2-13B。
另外,該公司表示,該模型支持消費級顯卡如1080Ti參數微調,以及主流手機處理器端側推理。
在大模型從業者們瘋狂堆砌參數的當下,面壁智能爲何會選擇另辟蹊徑地去主攻一款小模型?
在內參會上,曾國洋就這一問題做出了回答:把MiniCPM稱之爲小模型可能不太准確,較爲合適的名稱應該是“更高效的模型”,就是在有限的資源內去把模型做得更好。
“如果簡單地將模型參數規模做大的話,它確實會隨著scaling law出現效果的提升,但它單一維度的提升是低效的。我們在研究出一個更優化的方法之後,其實是可以隨著參數擴大,讓模型爆發出一種更明顯的增長。”曾國洋表示。
這裏需要解釋下scaling law的概念。即模型的最終性能主要與訓練計算量、模型參數量和數據大小三者相關,而與模型的具體結構(層數/深度/寬度)基本無關。研發人員可以通過它在固定資源預算中,如額定的GPU數量、訓練數據量或是訓練時長下,匹配模型的最佳大小,且無需經曆昂貴的試錯。
面壁智能的思路就是,在遵循scaling law的情況下,對模型的細節進行更好的優化,使其在同等成本下達到更好的效果。
而成本問題也可能是未來端側AI發展的最核心的推手。可以做個假設,如果未來在大模型領域出現了某個超級應用,會有上百萬,乃至上千萬人同時在線,用戶都在雲端使用模型的話,僅算力帶寬這一項成本,對于創業團隊來說都是難以承受的。
在今年2月MiniCPM發布會現場,面壁智能CEO李大海曾做過測算,用一台搭配骁龍855芯片的手機在本地端跑大模型,按照運行 5 年計算,每秒 7.5 tokens,那麽 170 萬 tokens 的推理成本僅需人民幣 1 元,成本僅爲 Mistral-Medium 的百分之一。
這裏有處有趣的細節是,骁龍855是高通于2018年發布的終端SoC,用于演示似乎有些過于落後了。
曾國洋在AI內參會現場的發言,大概解釋了這一問題:行業內有個誤區是手機等終端的算力不夠,但真正的瓶頸其實是顯存帶寬不夠。曾國洋認爲,隨著端側模型的落地,未來硬件層面可能會迎來一波升級。
“我覺得未來一到兩年的時間,我們有機會看到一個相當于GPT3.5的模型跑在手機上。”曾國洋表示。
* AGI時代,創業者們該怎麽辦?
無論是目前已經被大規模投入使用的雲側AI,還是行業內正在布局的端側AI,亦或是兩種混合部署,最終都指向行業翹首企盼的終極目標——AGI(通用人工智能)。
AGI聽起來距離我們還很遙遠,但無論是黃仁勳還是山姆·奧特曼都不止一次地表示過,AGI最快將在5年內問世。那麽在當下,人工智能的創業者們該如何面對這即將到來的行業內的最大變數?
極客邦科技副總裁、TGO鲲鵬會總經理楊攀認爲,經曆了互聯網時代和AIGC時代的創業者們很可能會陷入對兩大路徑的依賴當中:對移動互聯網的路徑依賴限制對AGI原生應用的想象,對雲計算的路徑依賴限制對OpenAI生態位定位的預判。
“業務負責人們需要思考的是,在不依賴當前AGI技術實現水平的情況下,對未來6-18個月的産品功能和市場變化做出預測。”楊攀表示,最終還是要落在場景上而不是功能上,因爲後者很容易被AI所碾壓。
正如一個無比現實的問題是,今年有望發布的GPT5,其能力可能會直接將部分應用甚至是行業覆蓋掉。
如何避免被GPT5折疊?在楊攀看來,無論大模型能力有多麽強大,最終它還是要同物理世界打交道,還是要接入外部的數據,如果你是數據的提供方,就會成爲它堅實的夥伴。
因此AI創業者們必須要審視手中的項目是否具備數據優勢,是否能給大模型提供數字世界或是物理世界的接口,以及同其他系統能力打交道的接口。
“相較于過去我們所熟知的程序,AI擅長的其實是模糊數據的處理,而這正是過去人類所擅長的工作。”楊攀補充道。---[出品 : 虎嗅科技組*頭圖 : 虎嗅拍攝/來源: 虎嗅]
*馬斯克最新訪談:中國聰明人很多 他們的AI絕不會落後于西方*
快科技4月9日消息,特斯拉CEO馬斯克在自家的X/Space播客上接受了訪談,主持正是前幾天爆火的蔡崇信訪談的主持人,尼古拉·坦根,挪威國家銀行投資管理公司的CEO。
當被問及"中國的AI現在相對于美國處于什麽位置"時,馬斯克回答道:"我不知道中國的具體位置,但我知道中國有很多非常聰明的人,他們不會落後于世界其他地方,也不會落後于美國。"
馬斯克表示,現在的人工智能主要集中在舊金山和倫敦,中國也發生了很多事情,雖然我不知道他們在做什麽,但我確信他們不會落後于西方。
同時馬斯克還重申:"但請記住我的話,如果我們不讓人工智能盡可能真實,它就會落後。這就是危險所在。"
馬斯克還透露,特斯拉在真實世界視頻方面具有相當大的優勢,因爲特斯拉擁有迄今爲止最多的真實世界視頻。---來源: 快科技 -