Kimi“顛兒了”以後:國産大模型危機感重重
導語:受Kimi影響,百度的文心一言和阿裏的通義千問,用戶訪問量大幅下滑,降幅分別達到33.42%與45.05%。
01. 此消彼長
問世以來,Kimi就在不斷“吊打”國內各大廠AI模型。
根據券商監測數據,截止3月25日,Kimi的網頁端、APP端的用戶DAU(Daily Active User,日活躍用戶數量)突破曆史新高,分別達到了79萬和54萬。疊加小程序用戶量,全端總DAU顯著大于225萬,或已超越百度(BIDU.O/9888.HK)旗下大模型文心一言的233萬。
而半個月之前,3月10日,Kimi的全端DAU剛剛突破120萬人。但其實早在2月,Kimi的用戶訪問量就已達到305萬,相較1月超翻倍增長。
與此同時,百度的文心一言和阿裏(BABA.N/9988.HK)旗下的通義千問兩大TOP2玩家,用戶訪問量則大幅下滑,降幅分別達到33.42%與45.05%。
數據屢破新高下,Kimi的一舉一動也被大廠關注並模仿。
Kimi是月之暗面推出的對話式AI産品。3月18日,月之暗面宣布Kimi支持200萬字的無損上下文輸入。而在半年之前,去年10月發布時,Kimi可支持的無損上下文輸入長度僅爲20萬字。
因此,大模型的“長文本能力”也受到大廠關注,甚至被認爲是大模型競爭的重要性能指標。
3月22日,通義千問升級,向所有人免費開放 1000 萬字的長文檔處理功能;360的智腦正式內測500萬字長文本處理功能,該功能即將入駐 360AI 浏覽器。
文心一言也宣布將于4月升級,屆時也將開放長文本能力,文字範圍預計將在200萬-500萬。
據筆者了解,不少業內人士卻並不看好這些大廠的“東施效颦”。他們認爲,Kimi在長文本領域的領先身位,並沒有那麽容易被超越。
或許正因于此,今年2月,在月之暗面最新一輪融資中,阿裏作爲領頭方,其投資額度的百分之七八十,被置換成算力服務。
02. kimi的靈魂
互聯網大廠,集中了各領域的技術頂尖人才,但鮮有像Kimi這樣的“明星員工”。
月之暗面創始人楊植麟,是Kimi團隊的靈魂人物。他擁有清華和卡內基梅隆背景,本人是長文本領域專家。
在過去五年內的自研語言處理(NLP)領域,楊植麟有相當的影響力。在華人學者引用排名中,楊植麟的學術論文位居前10,在40歲以下排名第一。
在讀博士期間,楊植麟就以第一作者身份發表Transformer-XL和XLNet兩項工作,在谷歌學術上被引用近兩萬次,並在多個NLP任務上取得了當時的最佳效果。
Transformer-XL成爲首個全面超越RNN的注意力語言模型,XLNet則在20項頂級會議中獲得最佳論文提名。
楊植麟以及他的團隊,創造了Kimi表現優秀的無損壓縮技術。這種技術可減少參數對存儲的需求、推理的算力,以及數據傳輸的帶寬占用,從而高效率無損處理百萬級的長Token。
而爲了快速趕上長文本熱潮,其他大廠只能退而求其次,選擇檢索增強生成RAG技術。
Kimi的無損長上下文窗口的方案,是在逐字閱讀全文後給出答案。RAG技術是對全文關鍵信息進行檢索生成答案,但可能會丟失掉部分關鍵的信息。
因此,與前者相比,無論對比輸出的深度還是精度,大廠的模型都還存在較大差距。
目前,Kimi並沒有公布無損壓縮技術細節。除了論文,該技術在學界也沒有太多開源內容可參照。大廠想要“學習”、並工程化是非常困難的。
技術之外,Kimi的戰略也值得思考。
爲快速“跟上形勢”,大廠一上手就追求花哨的多模態、導致“樣樣通樣樣松”走入平庸。
而Kimi選擇“一擊必殺”——首先垂直選擇打透長文本領域,以培養用戶心智,積累用戶留存。
自發布以來,Kimi除了將上下窗口從最初的20萬字拓展到200萬字之外,在指令理解、信息檢索能力和模型相應速度上,也持續叠代。
月之暗面內部人士介紹,基于Infra層的優化,Kimi生成速度較去年10月份提升了三倍。
2023年12月、今年1月和2月,Kimi用戶留存分別爲18.48%、22.25%和23.36%。這種高留存的粘性,同時形成了正反饋。
用戶們在使用過程中自發“喂”給Kimi很多專業語料。通過不斷學習和處理各種類型的語料,Kimi更能理解和適應不同的語境、問題和需求,從而提高其性能和准確性。
在此類專業語料處理上的進步速度,Kimi甚至快于Open AI。
這是因爲,目前Open AI對于C端用戶上傳文件仍然有限制。而對于Kimi用戶而言,則是親手培養了一個高學習力的免費私人助手,持續進行互動。
03. 加碼海外市場
正如馬斯克近日發言,升級技術路線的方法,不是與競爭對手比較,那就太簡單了。應是不斷挑戰物理極限。
超越百度等大廠,或許並非Kimi的目標。下一步擴張,月之暗面指向了海外。
目前,月之暗面正在對外招聘國內/國外效果廣告設計師。除國內廣告平台設計外,這一崗位,還需承擔公司産品在海外各大廣告平台,如Google,Meta,Tiktok等廣告創意設計。
同時,月之暗面也在補足運營短板。
月之暗面技術團隊僅有100多人,是頭部國産大模型公司中,人數最少的一家。包括安卓工程師、測試、市場、人力等等,都是公司正在招聘的崗位。
以産品增長職位爲例,該職位要求有大廠工作經驗且擅長通過社交媒體和用戶裂變策略推動産品增長,包括擁有從0到1000萬用戶增長的經驗,專注于提升活躍用戶數量和長期留存率等職責。
“打不過就加入”。對于Kimi的崛起,阿裏雖有自己的通義千問,但也給予了支持。
目前,Kimi借調了阿裏的英偉達(NVDA.O)A800以及A100 GPU處理器的機型進行擴容,未來Kimi算力側的支持,也將主要來自于阿裏。
今年2月,在月之暗面最新一輪超10億美元投資中,阿裏作爲領投方,其投資額度的百分之七八十,將被置換成算力服務器。
有了阿裏的支持,Kimi不用再擔心因爲算力不足而宕機。該人士也表示,擴容並非一步到位。一下子擴容太多,容易造成算力閑置和浪費,需要一定的策略。比如,Kimi也會對用戶的使用情況進行預測。
自從2022年11月ChatGPT發布以來,國內AI大模型已超200個,且還在持續增加。Kimi的問世,喚醒了行業巨頭的危機意識。
但Kimi也並非這場技術競賽的終點。---(來源:AI新智能/來源: 阿爾法工場 )