不落地,無意義:狂飆的AI大模型競爭到底有多殘酷?
「我實在不行了,論文實在是跟不上,代碼實在是跟不上。Just too much(太多了)。」
說出這些有點垂頭喪氣話的,不是別人,正是業界AI大牛,被認為是「中國AI布道人」、前百度集團總裁兼首席運營官、現奇績創壇創始人兼CEO的陸奇。在近期的一次分享活動上,陸奇直截了當地表示自己跟不上大模型時代的狂飆速度。
作為國內針對大模型最有發言權的人之一,陸奇都難以穿過迷霧真正看透大模型時代的走向,並被後者的發展速度所震驚,我們也就能夠知道天翻地覆的變化即將到來。縱覽當下大模型領域的態勢,或許用「百舸爭流千帆競」來形容最合適不過。
面對大模型時代帶來的大機遇,有能力的企業都在積極推出自家的相關產品,並積極搶占生態位。甚至大模型還成為了一個「噱頭」,不少企業都拋出來去蹭熱度、提高關注度。但無論造勢如何浩大、聲量如何喧囂,唯有真正落地,企業方有機會「成王」。
*紛紛入局,白熱化階段躍然而至
人人都知道一個必然趨勢——未來,是一個模型無處不在的時代。
只有站在風口上,才有扶搖直上九萬里的可能。國內國外資本市場、企業的注意力,都在被大模型吸引,並紛紛入局。例如在美國,今年1月到3月有很多資金投入到大模型領域,且每個月都保持着高增長。國內也基本一樣,商業模式、盈利模式有初步規模,基礎設施、平台應用、生態體系在加速推進,且科技巨頭、初創公司等都在進入。
猝不及防間,大模型時代在發展初期就迅速進入白熱化階段。這主要體現為:模型推陳出新、企業棋布錯峙。而在這場「大模型混戰」中,我們看到諸多熟悉的身影。
在模型方面,各大企業紛紛推出自家的大模型。比如,百度文心大模型包含NLP、CV等在內的系列大模型。文心大模型包含NLP大模型、CV大模型、跨模態大模型、生物計算大模型、行業大模型等。與Bing類似,文心一言有望優化C端用戶搜索、創作體驗;ToB方面,百度已開放大模型API接口,在文案、AI作畫、開放域對話方面賦能企業。對於具體行業,百度推出文心行業大模型,以「行業知識增強」為核心特色。
至於阿里巴巴的通義大模型,則由通義-M6模型融合語言模型和視覺模型組成,率先應用在硬件終端天貓精靈和軟件通義千問。通義大模型包括統一底座「M6-OFA」,三大通用模型「通義-M6」「通義-AliceMind」「通義-視覺大模型」,以及行業層面的不同垂直領域專業模型。
而騰訊混元大模型採用熱啟動降低訓練成本,文字視頻等多領域表現優異,已在廣告遊戲等多場景落地。此外,華為在算法、算力上儲備較為豐厚。比如「鵬城雲腦II」獲全球IO500排行五連冠,擁有強大的AI算力和數據吞吐能力。
字節跳動的AI探索基礎紮實,在語言大模型和圖像大模型初步布局。字節跳動的AIGC大模型將從語言和圖像兩種模態發力,預期在今年年中推出大模型。字節跳動在算力、算法、數據方面並無短板,目前模型可用於圖文、視頻內容生成等,飛書則推出智能AI助手「My AI」。
除了這些科技巨頭外,還有其他企業也在大模型領域伸出自己的「觸角」。4 月 10 日在商湯技術交流日活動上,商湯科技推出大模型體系「商湯日日新大模型」,包括自然語言生成、文生圖、感知模型標註、以及模型研發功能。此外,商湯科技還宣布推出商湯自研中文語言大模型應用平台「商量」。
而互聯網大佬殺入戰場進行創業,也在成為潮流。繼王慧文後,又一位互聯網大佬——搜狗公司創始人王小川攜5000萬美元,殺入大模型領域創業。在這個全新時代,屬於各路大牛的「諸神之戰」也愈發精彩。
狂飆,加速狂飆!所有有實力入局的企業、大牛都在提速,試圖搶占大模型新時代的制高點。對於科技領域來說,這樣熱鬧的景象已有很長時間不曾出現。大模型的亮相與進化,看起來要打破存在已久的桎梏和瓶頸。
*落地更重要,競爭的核心角力點
百舸爭流,奮楫者先;中流擊水,勇進者勝。
在看似熱鬧的大模型領域,眾多企業現在還只是處於「亮劍」狀態,並未展開貼身肉搏的白刃戰。這主要是因為企業不只是要對自家的大模型進行長時間且持續性的訓練,還要在應用層面進行摸索,並儘可能地發展更多的合作夥伴、賦能更多場景。
這也意味着,大模型領域的參與者其實都非常清楚:落地更為重要。否則,殘酷的一面就會出現——狂飆的車輪會把華而不實的湊熱鬧者狠狠碾過。
大模型領域的確在蓬勃生長,但繁榮態勢能夠持續多久,依然要取決於能否落地,並在應用層面實現質的突破。也就是說,大模型要通過良性循環讓自身健康發展。可以看到的是,落地正在成為企業在大模型領域展開競爭的核心角力點,也是通向「王座」的必由之路。
在落地這一方面,不少企業已經開始有了實際案例。
比如,百度在AI方面布局多年,具有一定大模型先發優勢。當前已經有650家企業宣布接入文心一言生態,還有更多的企業在排隊,申請文心一言API調用服務測試的企業已突破6.5萬。目前百度文心行業大模型在能源、金融、航天、製造、傳媒、城市、社科以及影視等領域,與國網、浦發、吉利、TCL、人民網、上海辭書出版社等均有案例應用。
阿里通義大模型在邏輯運算、編碼能力、語音處理方面見長,集團擁有豐富的生態和產品線,在出行場景、辦公場景、購物場景和生活場景均有廣泛應用。4月11日,2023阿里雲峰會在北京舉行,阿里巴巴集團董事會主席兼CEO、阿里雲智能集團CEO張勇在會上表示,阿里巴巴所有產品未來將接入「通義千問」大模型,進行全面改造,包括天貓、釘釘、高德地圖、淘寶、優酷、盒馬等。
騰訊混元大模型則已經在廣告投放、遊戲製作投入使用,比如在廣告業務中應用AI模型,助力廣告主提升廣告創作效率、提升廣告推薦系統的內容理解能力,大幅提升了廣告效率,實現降本增效。目前,騰訊集合集團內資源與頂尖人才,正在全力打造類ChatGPT對
話式產品,預計投入使用後將對QQ和微信生態有一定優化。
華為與B端合作緊密,現在及未來應用以ToB為主。華為盤古大模型是基於ModelArts研發設計的系列模型,在物流、藥物研發、氣象預測等多領域已實現落地。目前,盤古CV大模型已覆蓋物流倉庫監控等領域;NLP大模型覆蓋了智能文檔檢索、智能ERP和小語種大模型;科學計算大模型則應用於氣象預報、海浪預測等方面。
可以看到,眾多企業不僅在開展新一輪打模型競賽,還希望藉助大模型能力打造「模型即服務」的範式。產業鏈的豐富則將觸發新一輪變化,並刺激應用層面的百花齊放。
落地為王,是對大模型時代風向非常清晰的認知。這也能夠理解,為何企業更願意發力大模型和產業的結合。這也讓「客戶」和「MaaS(模型即服務)」成為高頻熱詞,「接入我們的大模型」則成為共同目標。隨着大模型應用的想象空間被進一步擴充、潛力被進一步挖掘,未來自然加速而至。-科技說說-