通用大模型創業潮,首戰即將終結
迅雷不及掩耳。
「暗涌waves」獲悉,AI創業公司Minimax正在以超十億美金的價格進行新一輪融資,該交易「正在交割過程中」。接近人士透露,「所有老股東都超額認購,而新股東大概有四五家」。此前,Minimax已完成兩輪融資,入局的投資方包括米哈遊、高瓴創投、IDG資本、雲啟資本、明勢資本等。
Minimax是目前大模型創業潮中估值最高的創業公司。除此之外,受到一級市場投資人關注的大模型公司還包括:王慧文的光年之外、智譜AI、楊植麟的新公司、沈向洋的新公司等。
除光年之外被《晚點LatePost》報道正在啟動第二輪融資、投前估值約10億美金外,據我們多方了解,其他公司的融資「也基本都有基金commit了」。
其中,Minimax和智譜AI分別成立於2021年和2019年,突出優勢是「起跑早,已經有相對成熟的大模型產品出來」,因而其估值相對更領先。
多位投資人表示,目前大模型創業的估值體系主要來自做成這件事需要的金額,以及團隊量級。
大模型產業鏈,可分為提供算力的基礎層、模型層和應用層。目前創業公司機會主要集中在模型層和應用層。其中大模型又分為像OpenAI 一樣提供API調取服務的通用大模型和基於開源大模型做微調的、差異化大模型。
一位投資人告訴我們,如果是做前一類的大模型,起步就需要5000萬美金。而如果想在市場有一定聲量,則需儘快拿到億美金級融資。而另一家投資機構合伙人告訴「暗涌Waves」,通用大模型創業,依賴重資源和強資金。無論投資人,還是創業者,都會是一個「少數人的遊戲」。
多位投資人向「暗涌waves」表示,儘管多家公司的交易還在具體流程中,但市場普遍認為,面向通用大模型創業的窗口期已基本關閉,其首輪資本軍備賽也基本接近尾聲。
在一家美元基金投AI的合伙人看來,創業公司的機會往往在於大廠形成共識前入場。一旦大廠形成共識,除非王慧文量級的旗幟型選手,抑或後期有超強產品sense——可以定義超級產品者,否則很難以小搏大。而對VC們來說,儘管仍然有人因為相信這是比移動互聯網大十倍的機會,所以對估值上限容忍度很高,但多數投資人認為,「頭部的肯定已經跟不動,其他的也要再觀望下」。
距離GPT4發布不過二十餘天,中國的通用大模型創業已將迎來第一個賽點。
上牌桌的人
任何一次創投浪潮興起之初時湧現的領先者,未必是最後的冠軍。在千團大戰、共享出行時代,這一點已被數次證明。但很多人認為,鑑於大模型創業更高的技術門檻、以及不會更低的資金和資源需求,後來者居上、或者說源自無名之輩的故事可能性較低。
多位投資機構合伙人告訴「暗涌Waves」,儘管如今大模型創業看起來風起雲湧,但實際上牌桌的不到10家,入局的VC機構也鳳毛麟角,基本集中在美元基金。
這些公司大致可分為兩個派別:來自AI公司、大廠的創業派,以及來自高校、研究機構的學院派。
在估值上跑得最快的是一直頗具神秘感的Minimax。它的核心團隊成員主要來自商湯科技、中科院、Uber等公司的AI團隊。
除此外,互聯網創業派還有王慧文的光年之外、搜狗創始人王小川的五季智能,前快手AI技術研發的核心人物李岩的元石科技、前京東AI掌門人周伯文的銜遠科技,以及李開復的Project AI 2.0等。
其中聲量最大的當屬光年之外。在真格、源碼等基金入局後,「暗涌Waves」了解到,王興、五源等個人和機構也參與其最新一輪投資中。
王小川的故事就更獨特一些。2021年,卸任搜狗CEO後,王小川一度沉迷在生命科學和醫學領域,並投出了小鹿中醫、DeepCare、熱心腸研究院等多家醫療公司。去年年中,他還在研究智能枕頭,但在2023年春節後,他火速決定奔赴大模型創業。
除此之外,還有原擔任京東集團副總裁、加拿大工程院外籍院士梅濤創辦的智象未來。目前智象未來已經光速完成阿爾法公社領投、多位中科大知名企業家、AI大專家組團跟投的種子輪投資。
在「學院派」大模型創業者中,清華系一騎絕塵:出現了唐傑參與的智譜AI,楊植麟參與的循環智能、而豈凡超的深言科技,以及曾國洋的面壁智能,則是前不久王慧文試圖收購的兩家公司。
概括來說,清華系的NLP創業者主要來自三個脈絡:唐傑和李涓子帶隊的知識工程實驗室(KEG)、孫茂松帶隊的自然語言處理與社會人文計算實驗室(THUNLP)以及朱小燕和其學生黃民烈帶隊的交互式人工智能(CoAI)課題組。
在唐傑和李涓子這支脈絡下,誕生了智譜AI。GPT4發布同一天,唐傑在微博宣布:基於千億參數大模型的對話機器人ChatGLM,現在開啟邀請制內測。而唐傑的學生,曾參與過華為「盤古」大模型研發的楊植麟,他的新公司同樣炙手可熱。
在「暗涌Waves」的採訪中,有投資人將楊植麟形容為:「有世界級科學家的視野,以及對技術路線的獨特嗅覺」。知情人士對我們表示,金沙江、今日資本、Coatue等機構均對楊植麟的新公司表現出投資意向,甚至陸奇個人也將參與其中。
在國內最早開展 NLP 研究的自然語言處理與社會人文計算實驗室(THUNLP)這條脈絡下,則誕生了孫茂松、劉知遠、深言科技的豈凡超以及面壁智能的曾國洋等人。
其中,孫茂松、劉知遠團隊研發的CPM模型,是智源研究院「悟道·文源」的前身。而深言科技的豈凡超以及面壁智能的曾國洋則是前不久王慧文試圖收購的兩家公司。
在交互式人工智能(CoAI)課題組脈絡下,朱小燕的學生黃民烈創立的聆心智能,在2022年就推出首個產品AI烏托邦,繼去年年底完成包括智譜AI在內的數千萬元天使+輪融資後,前不久又宣布完成Pre-A輪融資。
除高校外,登上中國大模型創業牌桌的,還包括一些來自非營利性AI科研機構,尤其是在相關領域有深度積累的IDEA(粵港澳大灣區數字經濟學院)和北京智源人工智能研究院的創業者。
其中,呼聲最高的,當屬由IDEA研究院創始人沈向洋擔任顧問,IDEA認知計算與自然語言研究中心負責人張家興創立的新公司。在微軟押注OpenAI的GPT模型之後的2019年11月,微軟人工智能最高負責人沈向洋宣布離開微軟。而他在微軟通用人工智能模型的最後一個作品是聊天機器人小冰。
除此外,還有來自西湖大學工學院的藍振忠打造的西湖心辰,來自微軟亞洲研究院周明打造的瀾舟科技,其中前者前不久也完成新一輪數百萬美元的Pre-A輪融資。投資方包括百度風投、凱泰資本和西湖教育基金會可持續發展平台。
路徑與終局
對通用大模型創業公司來說,短期壓力主要來自Chatgpt4的發布和大廠的圍追堵截。
繼百度發布文心一言後,騰訊正在加速推進大模型「混元」,阿里則將在4月的雲峰會上發布大模型進展,也有消息傳出,4月華為將發布對標CHATGPT的盤古大模型,而6月,積累了大量c端圖片和視頻數據的字節跳動也要發布自己的大模型。事實上,不久前的3月22日,原阿里M6大模型的前帶頭人楊紅霞也已加入字節AI Lab(人工智能實驗室),參與語言生成大模型的研發。
在一家美元基金投AI的合伙人看來,創業公司的機會除了在大廠形成共識前入場外,還需要以非共識的方式破局。
在他看來,儘管目前OpenAI更多把自己定義成一個底層的提供模型服務的公司,但在已有「ChatGPT」這個MVP(最小可行性產品)後,它很可能既做模型去覆蓋很多垂直場景,也做一個C端產品,重新定義交互,拿到新的C端流量入口。
如果這件事發生,就意味着創業公司可以在新場景的搶奪中,擊破大廠目前的既有強勢場景優勢,甚至出現創業公司和很多不同領域小巨頭合作的可能。
事實上,很多創業公司也開始放棄只做提供API服務的通用大模型方向,開始基於自己訓練的大模型、或開源模型,甚至小模型,去創造自己的場景,並去做應用類產品。
3月22日,王慧文在即刻發文招聘產品經理。而幾天後,原搜狗輸入法產品經理,被稱為「搜狗輸入法之父」的馬占凱宣布加入。之前有投資人認為,這或許是GPT4發布以及大廠進擊後,王慧文對團隊方向的調整。而據《晚點 LatePost》報道,王慧文創立的光年之外,搜狗前CEO王小川的新公司,都選擇同時做大模型和基於模型的應用。
當然,創業公司方向的選擇往往也與融資數額相關。華創資本投資人張金對暗涌Waves表示,做通用大模型的成本過高,一些拿錢少的公司很可能在後續中基於開源做有數據積累和用戶場景的小模型和其應用。
而如果OpenAI最終沒有這樣一個C端產品出現,一家美元基金投AI的合伙人,認為大廠與創業公司的競爭就會是另一種局面:要麼出局,要麼被收購兼併,要麼就在細分領域小而美。
除場景外,創業公司與大廠的競爭主要來自數據、算法、算力幾個維度。在上述投資人看來,因為數據的核心不是數據量,而是數據質量和工程化的能力,加上算法也能逐步追平,因此在數據和算法方面,創業公司和大廠並非不可一戰。
至於算力的搶奪以及成本的持續增高,他認為這將是大廠和創業公司共同的難題。
通常來說,1萬枚英偉達A100芯片是做好大模型的算力門檻,而處理1800億個參數的GPT3.5大模型,需要的GPU芯片數量可能是2萬枚。這是很多人認為只有雲廠商才有資格下場大模型創業的原因之一。
但事實上,國內雲廠商擁有的GPU也主要是中低性能產品。在A100GPU被美國受限後,很多公司不得不使用「閹割版」的替代 A800。後者的數據因為傳輸速率低,內存小,所以必然會影響到訓練速度。
而隨着軍備競賽升級,創業公司能否搶到也是問題。有投資人告訴「暗涌Waves」,因為A100成為稀缺品,市面的價格開始水漲船高,從官方的1萬美元一枚,約合人民幣7萬,漲到8、9萬,甚至10萬一枚。
而對大廠來說,在後邊的從千卡到萬卡轉變中,也要面對整個系統架構的巨大挑戰。何況除了算力成本,還有硬件採購成本、運營成本以及短期內商業化的困難等等。一位在硅谷觀察頗久的美元基金投資人告訴「暗涌Waves」,「除非百億美金公司,否則很難跟進這個遊戲。」
拾象是一家定位於全球科技投資的基金,也參與了部分海外大語言模型項目的投資。創始人廣密表示,短期內這場AI競賽還將迎來幾個賽點:在模型層,關鍵節點之一即已上牌桌的選手第一輪融資官宣,意味着大模型首輪融資窗口期告一段落;其二,國內第一個能力達到GPT3.5能力的自研大模型推出,並先占領開發者心智和生態。而在應用層,關鍵節點則是「第一個殺手級應用出現」,比如某個AI Native的應用快速做出千萬級別的活躍用戶。
至於這場遊戲的終局,大部分投資人認為「肯定是兩三家的寡頭競爭」。而上述美元基金投AI的合伙人則認為,拉到10年,它會比雲計算行業的集中度更高,「中國市場可能就剩四五家」,但其中會出現至少一家「從底層芯片到C端應用甚至是硬件機器人」完全打通AGI的「千億美金公司」。-[文:於麗麗、何麗芯*編輯:劉旌/來源:36氪獨家]