98年「AI天才」、面壁智能CTO曾國洋:我像在創造一個新的智能生命體
【環球時報報導記者: 楊沙沙 胡雨薇 王冬】美國斯坦福大學三名學生組成的一個AI(人工智能)團隊,抄襲中國大模型公司「面壁智能」的開源成果「小鋼炮」MiniCPM-Llama3-V 2.5的鬧劇,引發中美AI技術研發速度的對比。
「斯坦福抄襲事件」發生後,《環球時報》記者在第六屆北京智源大會見到了面壁團隊,無論是創始人劉知遠、還是CEO李大海,都盡力淡化此事。而面壁CTO(首席技術官)曾國洋的亮相,引起很多關注。
這位被稱為「AI天才」的26歲男孩,上臺時還被主持人笑問「畢業了麽」。被稱為「AI界春晚」的北京智源大會是一個純技術的會場,現場雲集眾多國內外AI領域人才,讓《環球時報》記者十分好奇,中國AI界的生態什麽樣?「抄襲事件」是否對中國AI界產生震動?中國和美國在AI研發上,處於一種什麽狀態?《環球時報》記者就此專訪了曾國洋。
曾國洋接受《環球時報》專訪。- 王 冬攝
抄襲事件漣漪
抄襲事件過去三周後,曾國洋從他自己的視角對《環球時報》記者還原此事。「最開始知道此事,還是來自開源網站GitHub的一些用戶反饋,我們找到一些相關線索和證據,最終證明(斯坦福大學)確實發生了一個不太好的套殼現象。」曾國洋表示,事件最終以斯坦福本科生團隊通過郵件形式道歉、刪除相關的代碼和產品收尾。
對此,斯坦福AI實驗室主任曼寧發文譴責抄襲學生,並稱MiniCPM「是很好的開源作品」。曾國洋表示,事件發生後,感受到挺多人的支持,也讓更多人了解到,在開源領域很多中國大模型是值得關註的。
面壁智能首席科學家、清華大學長聘副教授劉知遠接受《環球時報》記者采訪時也表達了同樣的感受,他認為,包括面壁在內的中國大模型,並不是因為抄襲事件才受到關註,之前中國在AI領域研發進展已經被關註。
一直被認為在「追趕美國」的國產大模型現在成了被抄襲的對象,是否意味著中國已經領先?曾國洋認為,不能說中美研發水平誰在前誰在後,而是一個「你追我趕」的狀態。
在開源領域,中國一直是大模型領域非常重要的一個玩家,中美都會不斷有前沿的突破性成果出現。盡管很多國家相關研究機構也參與到大模型研發當中,「但在聲量上,目前還是以美國和中國比較重要的重量級玩家為主」。
劉知遠表示,在學術研究方面,10年前中國已能在國際上發表很多不錯的學術論文。但他向記者一針見血地指出,相比國外,目前國內重復開發基礎大模型是一種跟風、浪費,國內需把高質量製造大模型的平臺系統搭建出來。他稱之為建造「大模型光刻機」。
「光刻機的科學原理我們也掌握,但中國高端光刻機被『卡脖子』,根本原因是我們在系統化、平臺化方面做得沒那麽好。」劉知遠以美國人工智能初創企業OpenAI為例說,ChatGPT推出來時,列出的貢獻者有數百人,但到今年2月,文生視頻大模型Sora問世,核心成員只有13人。這中間發生了什麽?
劉知遠認為,OpenAI將此前大量程序員、科學家等完成的基礎工作自動化、平臺化,形成了自己的「大模型的光刻機」。Sora在這個基礎上研發,自然不需要那麽多人參與。
劉知遠表示,需要更加清醒地認識到中國和先進技術水平的真實差距,「如果我們只是滿足於復現ChatGPT,那就意味著我們以後不可能做出Sora、ChatGPT4o來。我們要把自己的『大模型光刻機』給造出來,這是我們要努力的方向。」
*「《三體》影響了我的職業方向」
曾國洋是劉知遠在清華的學生,8歲自學編程、奧賽冠軍保送清華。2015年年底,當奧爾特曼、馬斯克等人創立OpenAI時,那時17歲的曾國洋,第一次接觸AI概念。
曾國洋最早接觸大模型,是OpenAI於2020年5月發布的GPT-3,當時他第一時間就去註冊賬號嘗試,他感覺到「人工智能將有重大突破性機會,在未來一定有很大想象空間」,這也促成劉知遠、曾國洋等人在2020年年底決定做國內第一個大模型。
「2019年那段時間,我們覺得,在NLP(Natural Language Processing, 自然語言處理,是計算機科學領域與AI領域中的一個重要方向——編者註)領域,我們已和國外基本上沒有太大差距。但是GPT-3出現後,對NLP領域帶來很大沖擊。」他說。
2021年,劉知遠牽頭成立了面壁智能,清華計算機本科畢業的曾國洋是三個創業核心人物之一。
為什麽叫面壁?曾國洋回憶,他們先是創立一個人工智能開源社區叫OpenBMB,BMB讀起來很像「面壁」,同時團隊裏有很多人是中國科幻作家劉慈欣科幻小說《三體》的粉絲,「面壁者」又在《三體》中扮演非常重要的角色,最後團隊選擇用「面壁智能」這個富有科技感的名字。曾國洋說,自己非常喜歡《三體》,「可以說,劉慈欣老師的《三體》影響了包括我在內中國一批人的職業方向」。
從10人到100人
在美國,也有一批年輕人在AI領域創業。Sora的核心團隊最小成員出生於2003年。美國AI初創公司Pika labs的創始團隊成員僅有4人,其中一個據稱是95後的「杭州哈佛女孩」郭文景。曾國洋表示,大模型是一個新的技術變革,給了很多具有挑戰精神、願意嘗試新技術的年輕人改變自己的機會。
在中國AI這個新興領域,既有白發蒼蒼的學者,也有像曾國洋這樣的年輕人。在第六屆北京智源大會上,《環球時報》記者看到,一位中年工程師現場提問時,恭恭敬敬喊曾國洋「老師」。曾國洋表示,中國AI圈內並不是論資排輩,大家都互相稱呼「老師」,大家都樂於去學習、接受新思想,主動去學習一些自己不懂的技術。
工作之余,曾國洋喜歡看新聞、去開源社區交流,甚至有時候還特別懷念寫代碼的日子。去年年初,面壁團隊只有10個人不到,目前已經擴展到100多人,曾國洋需要整體負責大模型的研發工作。26歲,當很多年輕人大學剛畢業走上工作崗位,曾國洋已經是面壁智能公司的CTO。
對於外界稱呼他是「AI天才」「中國版謝爾頓」,曾國洋坦言自己一直以來學習「還行」,也沒看過美劇《少年謝爾頓》。
「加入到計算機領域,去做人工智能,一直以來都是我的興趣愛好在驅動著我,AI是一種非常非常有創造力的工作,我的工作就像在創造一個新的智能生命體一樣。」曾國洋說,更願意稱呼自己是「AI藝術家」,「我在創造一個藝術性的生物」。
未來,AI能否取代人類?曾國洋認為,AI未來將作為一個助手去提升人類工作效率,並不能完全取代人類。對於AI完全取代了人類工作,這位26歲的年輕人有點向往,「也許人類可能就不需要工作了,會做一些更有創造性的事情,或者做自己特別想要做的事情」。---[來源:環球時報/環球網資訊]