01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

AI長文本之戰:Kimi快跑,大廠圍剿 | 焦點分析

2024032814:48

一條名爲“Kimi”的鲶魚,將大模型公司卷到了長文本的新戰場。

這款來自AI獨角獸月之暗面的大模型對話産品,最大的標簽就在于“長”。上下文窗口的大小,代表著一個模型的記憶力。窗口越長,模型單次可處理的文本就越長。對用戶而言,模型能讀懂的文字越多,在學習、工作等場景下就越有用。

深谙營銷之道的月之暗面,是國內乃至全球範圍內,第一家將“長文本”作爲標簽的大模型公司。2023年10月30日,打著“全球首個支持輸入20萬漢字”名號的Kimi Chat就快速在一堆卷榜單、卷參數的模型中,擁有了辨識度。

Kimi有多火?國信證券的調研顯示,從2023年10月到2024年3月,Kimi的DAU從10萬攀升到了300多萬,翻了30倍。自春節起大規模投放廣告後,SimilarWeb數據顯示,Kimi的訪問量在2月增長了107.6%,僅次于百度的文心一言和阿裏的通義千問。3月21日,無法承接過多用戶的Kimi App和小程序一度宕機,用戶需要排隊才能正常使用。

Kimi的爆火,還直接牽動了股市——一些與月之暗面有合作傳聞的上市公司,被冠以“Kimi概念股”之名,股價飙升。後續紛紛出來辟謠的海天瑞聲、中廣天擇,已經先吃上了Kimi的紅利,在3月20日應聲漲停。這段時間,滬深互動平台最多的問題是“公司是否與Kimi助手有合作”,又或是“公司有接入Kimi嗎”。



網上流傳的“Kimi概念股”名單。

在2024年3月24日的一場用戶活動上,月之暗面的幾位産品負責人直言:“我們不敢說太多,還是希望大家關注産品本身。”

而一場對Kimi的長文本圍剿戰,也已經在大廠中打響。3月23日,360 AI 浏覽器宣布內測500萬字長文本處理功能。百度的文心一言也被曝將在4月開放長文本功能,長度在200萬-500萬。阿裏的通義千問則一口氣免費開放了1000萬字的長文檔處理功能,坐上了“全球第一長”的寶座。

可炮制的技術,被驗證的需求

Kimi帶起的長文本之火,無外乎兩個原因:技術門檻不高,市場需求已經被月之暗面初步驗證。

2023年10月9日,Kimi帶著“全球首個支持輸入20萬漢字”的標簽走進大衆視野。彼時,這一上下文窗口長度達到了Claude-100K(約8萬字)的2.5倍,GPT-4-32K(約2.5萬字)的8倍。

不過,多名從業者對36氪表示,長文本處理的技術壁壘並不高。長文本建模的方案,主要有外部召回(借助外部工具處理長文本或者利用外部記憶存儲上下文向量)、模型優化、注意力計算優化三種,而每一種都有公開的研究論文和技術方案。

很快,Kimi“20萬字”的記錄就被他人打破。2023年10月30日,Kimi首發僅過了21天,王小川的百川智能就推出了上下文窗口達192K的大模型Baichuan2-192K,單次能處理35萬個漢字。11月,王座再次易位,李開複成立的零一萬物,又發布了能夠處理約40萬字的大模型Yi-34B,是Kimi的約2倍。

長文本帶來的模型競速,最根本的原因,還是在于看到了龐大的消費群體。

“C端用戶對大模型的需求無外乎兩種,一是提效工具,二是娛樂工具。”一名AI從業者告訴36氪。他認爲,目前AI對短文本的理解和生成能力,還沒完全超過人類,比如看咨詢、寫短文案,“人用在修改AI生成的文案的時間,其實不比自己從頭想來的少。”

但大模型相較于人的競爭力,恰恰在于理解長文本的效率。“10萬字的論文,一般人讀完起碼要30小時,還是在不休息的情況下,但大模型只要幾分鍾。”

一名法律行業AI産品經理向36氪提及,問答機器人、模擬法庭等AI産品在專業度高、實踐性強的法律行業都跑不通,唯一能跑通的只有對判決文書等長文本的總結,而“Kimi是目前律師等法律專業用戶認可度最高的一款AI産品”,不少律師用Kimi來總結資料,輸出法律文書。

Kimi的火爆,是苦于C端變現途徑的大廠所垂涎的。在大模型落地的打法上,體系龐大的大廠們,采用的基本是模型+雲服務、AI功能+原有産品的保守打法。在B端,這樣的打法初見成效。百度在2023年的財報中,強調了大模型對雲等B端業務的推動。

但大模型對App、搜索等C端産品營收的助推,依然是個謎。百度財報顯示,2023年12月,百度App的月活達6.67億,同比增長了3%——然而,這個數字與9月的6.63億基本持平,不及6月的6.77億。

而Kimi證明了,不采用和其他産品的“打包”模型,大模型本身也有拉新造血的潛力。通過月之暗面這個對手,大廠們完成了對長文本的市場驗證。

Kimi的難題是商業模式,大廠的難題是獲客

但要讓長文本真正造血,廠商們擔心的仍然是高昂的成本。

日前,Kimi的獲客成本就引發了討論。據新浪科技獲得的數據,算上廣告投放和算力成本,Kimi每個用戶的獲客成本達12-13元,按照近一個月17804的日均下載量計算,Kimi每日的獲客成本高達20萬元。



Kimi在B站投放的廣告。

每日20萬元的獲客成本,加之隨著參數規模水漲船高的大模型研發費用,對尚未商業化造血的月之暗面而言,燒錢的局面依然要維持一段時間。

初創公司的另一難題,則在于如何運營如此龐大的用戶群體,並提供穩定的服務。2024年3月21日下午,由于用戶數超出負荷,Kimi的App和小程序一度無法正常使用,用戶需要排隊等待。

但月之暗面的困境,對于作爲後來者的大廠們而言並非難題。億歐智庫2022年3月的數據顯示,中國互聯網企業的平均獲客成本在380-580元之間。

可以說,Kimi人均不到20元的獲客成本,對于大廠而言,反倒是用更低的獲客成本,找到了新的流量入口。

而在服務質量上,算力資源、人力資源充足的大廠,更容易輸出穩定的服務。而在技術上,一名AI從業者告訴36氪,將可以處理1000萬字的通義千問後和Kimi比較,可以發現同等文本的解讀,通義千問的總結完成度略高一籌。甚至于,360的長文本功能,增加了摘要和思維導圖的能力。

但後來者的劣勢,也恰恰在于失去了先發優勢和辨識度。

當面向龐大的C端用戶,亮眼的營銷手段顯得格外重要。被當成過河搭石的Kimi,勝在有一個別出心裁的亮相,早早就貼上了“長文本”的標簽,在一衆大模型模糊的面孔中打出了差異化。至少提到“長文本”,用戶腦海中最先跳出的,大概率是月之暗面的Kimi。

而大廠的包袱,還在于要爲用戶提供更完整、更複雜的産品體系。不少體驗過各家大模型産品的用戶都告訴36氪,大廠模型産品的UI設計、插件生態很複雜,功能過多,導致用戶的需求要經過多步操作解決。但Kimi的界面很簡潔,對于用戶而言,使用門檻反而降低了。



Kimi首頁。

Kimi的爆火已經爲商業化創造了時機。月之暗面表示,有用戶反映是否可以用付費解決等待的問題,今年公司會有初步的商業化方案。

只是找到合適的商業模式,證明自身的造血能力,是月之暗面接下來面臨的考題。面對異軍突起長文本之戰,當Kimi在用戶前構築了一道付費牆,能否貼牢“長文本第一家”的標簽,還未可知。---[文 : 周鑫雨*編輯 : 蘇建勳/來源: 36氪]