崛起的「清華系」,被改變的中國大模型格局
如果要給中國大模型的創業圖譜尋找一個坐標系,清華大學東門外的幾棟樓或許是最好的選擇。
幾個十字路口,隔着幾層樓,矗立着的樓宇里聚集着中國大模型行業的先行者。最矚目的要數搜狐網絡大廈,它位於園區的東南角,二層是王小川的百川智能,七層到十一層是來自清華知識工程研究室(KEG)的智譜AI。距離這裡不遠的地方,是聆心智能、深言科技與瀾舟科技等明星創業公司。
儘管創業的時間與契機並不相同,但它們都共享着一個身份——清華系。
在中國人工智能技術的發展史上,「清華系」註定是一個無法繞開的節點。這裡是中國人工智能教育的原點之一,六十多年前,當一輛接新生的大卡車在夜色中徑直開到宿舍門口,彼時還未與人工智能結緣的張鈸院士還在心中感嘆「清華園真大」,距離清華計算機系正式成立「人工智能與智能控制」教研組也有數年。
而如今,在大模型掀起的新一輪AI浪潮下,「清華系」的創業者已成為了其間不可或缺的關鍵力量。為什麼是清華?清華系崛起背後,又有何深意?
大模型浪潮里,「清華群星」閃耀時
任何創業圈都習慣為創業者貼上標籤,「標籤」既可以讓資本快速篩選優質標的,同樣也是初創企業最好的簡歷,而對技術密集型的企業而言,「學歷」無疑也是最好的標尺之一。
翻開此輪的大模型創業名單,無論是已有所成就的創業大佬,還是眼下的創業新手,「清華群星」幾乎占據了大壁江山。
曾經的「互聯網四傑」,搜狗創始人王小川,在尚未創業時,媒體給他貼上的標籤是「清華天才少年」。這位被點招進入當時清華大學計算機系的學霸,幾乎每年還會參加清華計算機系的學生節。現在,45歲的王小川有了一個新身份——大模型創企「百川智能」的創始人。
淡出創業圈多年後,這位曾經的創業大佬選擇投身大模型,認為做大模型是一件特別適合自己的事。「大家沒人說過「小川適合做搜索」,但都說「百川適合做大模型」,對我來講,是一件非常幸運的事。」
而比王小川更早些選擇投身創業的,還有銜遠科技創始人周伯文,他是清華大學電子工程系的長聘教授。另一家被騰訊、米哈遊、高瓴等明星機構押注的MiniMax,其創始人為前商湯科技副總裁閆俊傑,閆本人也曾在清華大學計算機系從事博士後研究。
如王小川一樣的創業者往往參與或經歷過大公司前沿技術的探索過程,他們的創業既是為了個人理想,也先天自帶商業化優勢,信奉的是「大力出奇蹟」。從百川智能先後推出開源和閉源的模型產品中就能看出,「藉助先發優勢,搶占身位」是他們從上一輪技術浪潮中學到的競爭法則。
另一派同屬清華系的創業者,無論從公司架構還是發展歷史,其氣質也更為「學術正統」。
由清華計算機系李涓子和唐傑教授擔任首席科學家的智譜AI,其孵化於清華的知識工程研究室(KEG)。該實驗室成立於上世紀九十年代,一開始走的就是「科研+工程化落地」的路線,而唐傑教授的得意門生楊植麟則在今年創立了月之暗面,其技術背景備受投資人青睞。
深言科技和面壁智能則脫胎於清華自然語言處理與社會人文計算實驗室(THUNLP)。THUNLP創立於上世紀七十年代,創建者為我國NLP領域的泰斗級人物黃昌寧教授,如今的學術帶頭人則為其弟子——清華大學計算機科學與技術系教授、清華大學人工智能研究院常務副院長孫茂松。而上述兩家創企的創始人均為孫茂松的學生。
隸屬於清華計算機系下的交互式人工智能課題組(CoAI),其學術帶頭人為朱小燕教授和黃民烈副教授。從CoAI里走出的聆心智能,對標的是大洋彼岸外的Character.AI。而由清華計算機系教授朱軍帶隊的新AI公司生數科技也已完成兩輪融資,朱軍師從清華大學計算機系教授、中科院院士張鈸。
學院派創業的特點是,一方面有着極強的技術基因,其產品背後的技術路線並非一日而就,而是代代師承的結果。另一方面,對比此前的AI創業熱潮,學者們入局的速度正在加快,產投研一體化的趨勢突出。
如深言科技創始人豈凡超的恩師孫茂松擔任深言科技首席科學家,豈凡超想和教授交流時,只用走幾百米回學校,面壁智能背後也有智譜AI的參股,月之暗面的另一名創始成員也來自清華大學計算機系,和楊植麟師出同門。
另一方面,在此輪大模型創業背後的投資方中,「清華系」的創投者們也頗為矚目。包括圖靈創投、卓源資本、清華控股、水木清華校友種子基金、無限基金SEE Fund等清華系創投機構也頻頻出手。如圖靈創投投了聆心智能、智譜AI,起源於清華大學FIT樓實驗室的卓源資本投了生數科技。
技術、人與錢,決定着此輪大模型創業的格局,清華在此輪競爭中似乎有着得天獨厚的優勢。但另一個問題也隨之而來,為什麼是清華?
「清華系」崛起:歷史、情懷與機制的勝利
今年6月,53歲的360創始人周鴻禕被清華大學計算機科學與技術系電子信息專業錄取,他在自己的微博上曬出一則錄取通知書,也引發了人們對清華大學與的人工智能學科建設的好奇。
事實上,在中國人工智能技術的發展史上,「清華」註定是一個無法繞開的節點。此輪大模型熱潮中,清華系之所以成為創業主力,背後是歷史、情懷與機制的支撐。
首先,離不開的是學科建設歷史的沉澱,這也是清華系的底層技術實力。
1978年,為了滿足國家發展計算機科技的需要,清華大學自動控制系更名為「計算機技術與應用系」,內部同時成立了「人工智能與智能控制」教研組,正式探索人工智能方向的本科教學,張鈸院士回憶起當時的中國人工智能發展用「一窮二白」來形容:「當時國內科研人員對人工智能領域發展的認識很有限,甚至相關資料也非常少。」
在對人工智能領域的初步了解後,學者們確定了幾個具體的方向,比如專家系統、自然語言、語音識別和智能控制等。但為了彌補與國外研究的差距,他們一邊向外看,去國外進修學習,將國外的先進知識翻譯到國內,同時開展前沿科研工作,另一邊則不斷探索與完善學院內部的培養計劃。
彼時,張鈸院士作為訪問學者前往美國伊利諾伊大學香檳分校進修學習,黃昌寧教授則趕赴耶魯大學進行為期一年的訪問。據張鈸院士回憶,他通過將伊利諾伊大學使用的教材和相關材料全部複印並寄回國內,這些遠渡重洋的珍貴資料成為了輔助清華大學計算機系教研工作的利器之一。
於此同時,清華大學也開始為本科生開設《人工智能導論》等相關選修課,有效填補了當時國內的課程空白。1983年,清華計算機系又將《人工智能》列為本科必修課程,相關教師也相繼編寫了人工智能方向的教材,如《人工智能原理》(石純一,林堯瑞)、《人工智能及其應用》(徐光佑編譯)、《人工智能手冊》(鍾玉琢編譯)等。
也是在這一時期,中國學者開始在世界人工智能界嶄露頭角。張鈸院士完成了中國科學家在人工智能領域的第一篇學術論文,並成功發表於人工智能領域頂級國際期刊上,由此開啟了人工智能發展的新篇章。
除了本科生教育體系的搭建,從1978年開始,清華開始招收人工智能碩士研究生,1986年,開始招收人工智能方向的博士生。同時通過建設一流的實驗室,加強國際合作與交流等舉措,清華不斷夯實其在人工智能領域的競爭力。
一個最典型的案例就是「姚班」的建立。清華大學利用企業的贊助資金,積極邀請世界著名的教授參與清華的培養工作。在2003年到2006年,圖靈獎獲得者姚期智作為受聘者,與清華結緣,而後直接回到清華大學擔任長聘教授,並創建了「姚班」。
「半數英才聚清華,清華英才在姚班」。如今從姚班已走出的一大批畢業生,也撐起了中國人工智能的半邊天。
歷史的沉澱外,創業情懷也是清華系的特點之一。在上一輪的互聯網創業潮中,清華系創業者身上就展現出了極強的創業意願以及對事物本質的探索精神,這在美團的王興、快手的宿華、豆瓣的阿北、搜狗的王小川身上都有明顯的體現。
而在此輪的大模型浪潮中,應用場景的選擇,商業模式的構建以及技術路線的抉擇都需要這種回歸本質的精神。換言之,創業者必須要對自身的優勢與未來技術的發展作出較為準確的研判。
這之中,相較於智譜AI等較早入局大模型的創企,王小川的百川智能作為「後發者」,就先通過較快的產品迭代,藉助過往的做搜索的優勢,打出聲量,王小川的理解是「先填補國內商業生態的空白」。周伯文的銜遠科技則是聚焦大模型對人與產品關係的重塑,聚焦消費品供應鏈這一垂直場景,這源於他過往在老東家京東的經驗。
質疑總縈繞在耳邊。比如,外界認為,做通用大模型是大廠的事。再比如,也有投資人對周伯文說:「你把事情做小了。」
但清華系創業者大多關注本質,對於「競爭」想的並不多。王興曾說過一句話:「太多人關注邊界,而不關注核心」。在清華大模型創業者身上,也有類似的創業氣質,他們接受競合是一種常態。
最後,清華系的崛起,也是一種開放機制的勝利。
其中,不得不提及的就是成立於2018年的北京智源人工智能研究院(以下簡稱:智源)。
這一獨立於政府、商業、和高校之外的非營利的新型科研機構,被稱為大模型行業的「黃埔軍校」。微軟總裁布拉德・史密斯此前曾在一次採訪中認為:目前在人工智能領域,世界上三家公司處於絕對前列,一個是與微軟合作的Open AI,第二個是谷歌,第三個是北京智源人工智能研究院。
智源既是一個非盈利機構,一個技術社區,同樣也是一個理想化的「烏托邦」。2020年,智源開始實踐大模型,啟動「悟道大模型」項目,不問英雄出處。根據「雷鋒網」的報道,包括清華、人大、北大、中科院等高校的學者與老師,一些外部成員也參與了進來,組團攻克中國大模型的難關。這個項目里集合了如今我們所知道的諸多清華系的大模型創業者:唐傑、劉知遠、黃民烈、楊植麟......
可以這麼說,立於大模型浪尖的清華,其崛起既是前人探索的沉澱,同樣也是當代「產學研」創新機制下的結果。
大模型的競爭,歸根到底是「人」的競爭
清華系崛起,五道口造夢。一切商業競爭,回歸本質依舊還是關於「人」的競爭。
大洋彼岸外,表面正酣的大模型熱潮,谷歌和OpenAI的人才戰爭則是水面下的暗線。據媒體報道,在過去的五年裡,超過30位高管、工程師或其他員工離開了OpenAI選擇創業,據「量子位」統計,OpenAI的51位研究人員中,有16位人才離開了OpenAI,離職率高達三分之一。這群OpenAI的叛逃者被稱為「OpenAI黑手黨」。
而他們所構建的人脈網與資本網,將聰明的人與聰明的錢串聯在了一起,這種獨特的「叛徒文化」既帶來了一個各司其職、分工明確的創新生態,也鑄就了多元與豐富的「獨角獸土壤」。
當然,中美國情的差異化,OpenAI的故事註定無法復現,可能的原因有三:
一是,時間的差異,區別於美國應用層的繁榮,中國大模型底層格局依舊未定,因此應用層發展仍在初期。
二是,路線的分化。美國大模型注重底層技術的研發與創新,例如在硬件和深度學習框架上都處於世界領先地位。而中國更聚焦在應用層,強調融入產業,以及商業的變現。
三是,塔尖人才分布的差異。根據未盡研究的統計,在全球範圍內入選人工智能學科AI2000名單的頂尖學者中,美國多是來自於科技企業。例如,谷歌、微軟、Meta合計招攬了三成的美國頂級學者。而中國的人工智能頂尖研究人員,壓倒性地來自高校,阿里巴巴則是中國招攬了最多頂級學者的企業。
「清華系崛起」背後,釋放出了一個新信號:從研究到創新,從象牙塔到企業,更多的頂尖人才正藉助商業力量推動技術創新實現具體應用場景的落地。更多的青年科學家也正在以自己的方式,帶來新的創新。
區別於上一輪的互聯網創業潮,此輪的大模型熱潮似乎已不是一個「以輸贏論英雄」的年代。清華大模型的創業圖譜已然說明了一切,它包容多元,歡迎創新,也樂於共享,甚至超出了單純的競爭思維。
但挑戰依舊擺在眼前。如何提升創新效率,建立更健康的創新生態,這既需要創業者對自身有着更精確的定位,對技術有敏銳與理智研判,同樣也依賴於政策、資本與學界的合力,探索出一套更先進與高效的合作方式。-[文:硅基研究室*作者:山核桃/鈦媒體]