AI長文本之戰：Kimi快跑，大廠圍剿 | 焦點分析

2024032814:48

一條名爲“Kimi”的鲶魚，將大模型公司卷到了長文本的新戰場。

這款來自AI獨角獸月之暗面的大模型對話産品，最大的標簽就在于“長”。上下文窗口的大小，代表著一個模型的記憶力。窗口越長，模型單次可處理的文本就越長。對用戶而言，模型能讀懂的文字越多，在學習、工作等場景下就越有用。

深谙營銷之道的月之暗面，是國內乃至全球範圍內，第一家將“長文本”作爲標簽的大模型公司。2023年10月30日，打著“全球首個支持輸入20萬漢字”名號的Kimi Chat就快速在一堆卷榜單、卷參數的模型中，擁有了辨識度。

Kimi有多火？國信證券的調研顯示，從2023年10月到2024年3月，Kimi的DAU從10萬攀升到了300多萬，翻了30倍。自春節起大規模投放廣告後，SimilarWeb數據顯示，Kimi的訪問量在2月增長了107.6%，僅次于百度的文心一言和阿裏的通義千問。3月21日，無法承接過多用戶的Kimi App和小程序一度宕機，用戶需要排隊才能正常使用。

Kimi的爆火，還直接牽動了股市——一些與月之暗面有合作傳聞的上市公司，被冠以“Kimi概念股”之名，股價飙升。後續紛紛出來辟謠的海天瑞聲、中廣天擇，已經先吃上了Kimi的紅利，在3月20日應聲漲停。這段時間，滬深互動平台最多的問題是“公司是否與Kimi助手有合作”，又或是“公司有接入Kimi嗎”。

網上流傳的“Kimi概念股”名單。

在2024年3月24日的一場用戶活動上，月之暗面的幾位産品負責人直言：“我們不敢說太多，還是希望大家關注産品本身。”

而一場對Kimi的長文本圍剿戰，也已經在大廠中打響。3月23日，360 AI 浏覽器宣布內測500萬字長文本處理功能。百度的文心一言也被曝將在4月開放長文本功能，長度在200萬-500萬。阿裏的通義千問則一口氣免費開放了1000萬字的長文檔處理功能，坐上了“全球第一長”的寶座。

可炮制的技術，被驗證的需求

Kimi帶起的長文本之火，無外乎兩個原因：技術門檻不高，市場需求已經被月之暗面初步驗證。

2023年10月9日，Kimi帶著“全球首個支持輸入20萬漢字”的標簽走進大衆視野。彼時，這一上下文窗口長度達到了Claude-100K（約8萬字）的2.5倍，GPT-4-32K（約2.5萬字）的8倍。

不過，多名從業者對36氪表示，長文本處理的技術壁壘並不高。長文本建模的方案，主要有外部召回（借助外部工具處理長文本或者利用外部記憶存儲上下文向量）、模型優化、注意力計算優化三種，而每一種都有公開的研究論文和技術方案。

很快，Kimi“20萬字”的記錄就被他人打破。2023年10月30日，Kimi首發僅過了21天，王小川的百川智能就推出了上下文窗口達192K的大模型Baichuan2-192K，單次能處理35萬個漢字。11月，王座再次易位，李開複成立的零一萬物，又發布了能夠處理約40萬字的大模型Yi-34B，是Kimi的約2倍。

長文本帶來的模型競速，最根本的原因，還是在于看到了龐大的消費群體。

“C端用戶對大模型的需求無外乎兩種，一是提效工具，二是娛樂工具。”一名AI從業者告訴36氪。他認爲，目前AI對短文本的理解和生成能力，還沒完全超過人類，比如看咨詢、寫短文案，“人用在修改AI生成的文案的時間，其實不比自己從頭想來的少。”

但大模型相較于人的競爭力，恰恰在于理解長文本的效率。“10萬字的論文，一般人讀完起碼要30小時，還是在不休息的情況下，但大模型只要幾分鍾。”

一名法律行業AI産品經理向36氪提及，問答機器人、模擬法庭等AI産品在專業度高、實踐性強的法律行業都跑不通，唯一能跑通的只有對判決文書等長文本的總結，而“Kimi是目前律師等法律專業用戶認可度最高的一款AI産品”，不少律師用Kimi來總結資料，輸出法律文書。

Kimi的火爆，是苦于C端變現途徑的大廠所垂涎的。在大模型落地的打法上，體系龐大的大廠們，采用的基本是模型+雲服務、AI功能+原有産品的保守打法。在B端，這樣的打法初見成效。百度在2023年的財報中，強調了大模型對雲等B端業務的推動。

但大模型對App、搜索等C端産品營收的助推，依然是個謎。百度財報顯示，2023年12月，百度App的月活達6.67億，同比增長了3%——然而，這個數字與9月的6.63億基本持平，不及6月的6.77億。

而Kimi證明了，不采用和其他産品的“打包”模型，大模型本身也有拉新造血的潛力。通過月之暗面這個對手，大廠們完成了對長文本的市場驗證。

Kimi的難題是商業模式，大廠的難題是獲客

但要讓長文本真正造血，廠商們擔心的仍然是高昂的成本。

日前，Kimi的獲客成本就引發了討論。據新浪科技獲得的數據，算上廣告投放和算力成本，Kimi每個用戶的獲客成本達12-13元，按照近一個月17804的日均下載量計算，Kimi每日的獲客成本高達20萬元。

Kimi在B站投放的廣告。

每日20萬元的獲客成本，加之隨著參數規模水漲船高的大模型研發費用，對尚未商業化造血的月之暗面而言，燒錢的局面依然要維持一段時間。

初創公司的另一難題，則在于如何運營如此龐大的用戶群體，並提供穩定的服務。2024年3月21日下午，由于用戶數超出負荷，Kimi的App和小程序一度無法正常使用，用戶需要排隊等待。

但月之暗面的困境，對于作爲後來者的大廠們而言並非難題。億歐智庫2022年3月的數據顯示，中國互聯網企業的平均獲客成本在380-580元之間。

可以說，Kimi人均不到20元的獲客成本，對于大廠而言，反倒是用更低的獲客成本，找到了新的流量入口。

而在服務質量上，算力資源、人力資源充足的大廠，更容易輸出穩定的服務。而在技術上，一名AI從業者告訴36氪，將可以處理1000萬字的通義千問後和Kimi比較，可以發現同等文本的解讀，通義千問的總結完成度略高一籌。甚至于，360的長文本功能，增加了摘要和思維導圖的能力。

但後來者的劣勢，也恰恰在于失去了先發優勢和辨識度。

當面向龐大的C端用戶，亮眼的營銷手段顯得格外重要。被當成過河搭石的Kimi，勝在有一個別出心裁的亮相，早早就貼上了“長文本”的標簽，在一衆大模型模糊的面孔中打出了差異化。至少提到“長文本”，用戶腦海中最先跳出的，大概率是月之暗面的Kimi。

而大廠的包袱，還在于要爲用戶提供更完整、更複雜的産品體系。不少體驗過各家大模型産品的用戶都告訴36氪，大廠模型産品的UI設計、插件生態很複雜，功能過多，導致用戶的需求要經過多步操作解決。但Kimi的界面很簡潔，對于用戶而言，使用門檻反而降低了。

Kimi首頁。

Kimi的爆火已經爲商業化創造了時機。月之暗面表示，有用戶反映是否可以用付費解決等待的問題，今年公司會有初步的商業化方案。

只是找到合適的商業模式，證明自身的造血能力，是月之暗面接下來面臨的考題。面對異軍突起長文本之戰，當Kimi在用戶前構築了一道付費牆，能否貼牢“長文本第一家”的標簽，還未可知。---[文 : 周鑫雨*編輯 : 蘇建勳/來源: 36氪]

我要留言

AI長文本之戰：Kimi快跑，大廠圍剿 | 焦點分析

追問｜“返老還童”有可能嗎？專家解惑“生物學年齡”

全球最強開源模型一夜易主，1320億參數推理飙升2倍！

追問｜“返老還童”有可能嗎？專家解惑“生物學年齡”

全球最強開源模型一夜易主，1320億參數推理飙升2倍！