中國國內大模型能達到Sora水平嗎?權威解讀來了
[本報記者:李明會*北京報導]
伴隨著ChatGPT、Sora、Figure01不斷引發全球關註,人工智能(AI)的驚人叠代速度不斷擴展著人們的想象空間。
中國正發出擁抱新一輪科技和產業浪潮的新信號,發力以人工智能為引擎的新質生產力。
自2017年以來,人工智能多次被寫入《政府工作報告》。2024年兩會期間,「人工智能+」首次被寫入《政府工作報告》。報告提出,深化大數據、人工智能等研發應用,開展「人工智能+」行動,打造具有國際競爭力的數字產業集群。
問題隨之而來,作為人工智能發展的核心引擎,國外的大模型不斷引爆國內輿論場、刷新大眾認知,我們的國產大模型還能彎道超車嗎?今年是大模型應用元年,在現實的不同場景之下,大模型又將與產業擦出什麽樣的火花?
4月13日晚間,中央廣播電視總臺財經節目中心《對話》欄目播出了新一期節目《AI+未來大猜想》。四位企業家——360集團創始人周鴻祎、國產大模型獨角獸智譜AI CEO(首席執行官)張鵬、人形機器人初創公司九光智能創始人徐誌根、廣藥集團董事長李楚源,以及三位財經媒體代表——《華夏時報》執行總編輯張誌偉、《中國企業家》雜誌副總編輯何伊凡、《財經》雜誌副主編朱弢,和中央電視臺主持人靳強一道共同探討人工智能的技術發展、商業化路徑等話題。
對於上述兩個問題,本文擷取了相關節目要點。
* 大模型做「小」也能彎道超車
靳強:OpenAI發布Sora,掀起新一輪對人工智能的討論熱潮,國產大模型能達到Sora的水平嗎?
張鵬:Sora確實令人驚艷,但我們仔細研究了它的技術報告之後,發現它並沒有外界看起來的那麽新奇。Sora運用到的仍是已有的技術,只不過OpenAI把這些技術綜合起來從工程上進行了優化,做到了之前的人沒有做到的事情。
我覺得,國產大模型能否做到Sora這種水平就是一個資源和時間的問題。因為Sora本身還有很多創新的技術大家還在研究,我也不敢特別準地去預測需要多少時間,但我相信應該不需要太久。
張誌偉:周鴻祎先生在今年兩會期間接受《華夏時報》記者采訪時曾表示,中國大模型的水平相當於美國GPT-3.5的水平。如何做出這個判斷?
周鴻祎:首先,我認為有差距是必然的,知道差距是多少,剩下的就是追趕問題。
我現在說話比較謹慎,你說大了,別人說你自卑;你說小了,別人說你自大。按照刷榜的成績,國內的模型早就超過了GPT-4了。但真正用一用,我覺得國內的大部分都達到或者超過了GPT-3.5的能力,全世界也就只有中國有這個能力。
如果GPT-4是100分的話,GPT-3.5差不多應該有75分到80分,我認為這個速度就很快了。
其次,美國也不是全面領先,美國真正在人工智能領先的公司,我認為就兩家,軟件是OpenAI,硬件是英偉達。
我認為,大模型比光刻機、芯片的難度要低很多,因為畢竟是軟件,但未來是要奔著AGI,也就是通用人工智能去的,這塊的挑戰就是算力。
但如果把大模型越做越小,走垂直化、產業化、企業化、場景化的道路,可能不需要萬億、千億的參數,只需要百億的參數,再加上一些私有的核心數據加持,在一個垂直單元上是可以超過GPT-4的。這就對算力的要求就降到很低,可能有十張消費級顯卡在一個場景就能用起來,非常適合我們國家,這也是我們彎道超車的一個場景。
我們有這麽多的工業門類,國家這麽重視製造業的數字化轉型,如果中國企業都用上了這種小規模的大模型,在自己的場景上讓大模型跟業務相結合,其意義不亞於我們在超級AGI上追趕國外。
* 大模型與產業的結合:小切口,大縱深
張誌偉:周鴻祎先生說過,今年是大模型場景應用元年。關於大模型如何與產業相結合,你提出了一個理念,叫「小切口,大縱深」。能不能展開聊聊?
周鴻祎:我們去年從to B模式中找到一些方法論。
比如,要給醫療機構做一個醫藥醫療大模型,必須把醫療進行場景細分——在裏邊找出50到100個場景,並對每個場景分析,看看文章生成、情感判斷、內容翻譯等大模型最常見的功能能不能發揮作用。
能不能做這個大模型取決於兩個因素:一是場景下有沒有數據知識,因為沒有知識、光有場景,訓不出大模型。二是看大模型的容錯度,因為大模型最致命的就是「幻覺」,如果某個場景中不能承受幻覺風險,那這個場景就不能用到大模型裏。
所以我主張要在企業用大模型不要一下子宏大敘事,而是在內部業務鏈條,或在外部產品功能中,選取兩到三個場景,用大模型賦能。如果能取得成績,我認為就已經是很大的進步了。所以,我談的「小切口」,就是剛開始寧可保守一點,積小勝於大勝。
而「大縱深」是什麽概念呢?大模型像發動機,現在大模型廠商在造世界上最牛、最快的發動機,但是B端企業要的不是發動機,而是一輛車。所以,我們要找到一個底盤,把發動機裝上,再給它裝上外殼、座椅,最後交付一輛車,企業才能用。
2023年,中國有上百家公司在做大模型,魚龍混雜,泥沙俱下。今年就消停很多了,因為很多企業知道,有些特別難的事自己也做不了。據我了解,現在的大模型廠商紛紛轉型,往產業方向走、往垂直方向走。
張鵬:通用大模型的能力提升所衍生的能力,能讓我們去尋找到「大模型原生的應用」或者「大模型原生場景」。但是在這個過程當中,技術需要發展,產業也需要落地。打個比方,現在我們造出內燃機了,不能說我想造飛機,內燃機不能用,我不管了,我要造噴氣發動機去。既然內燃機可以造出汽車,那就先把汽車造出來,我覺得這是不矛盾的一件事情。---[責任編輯:孟俊蓮*主編:張誌偉/來源:華夏時報]