01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

中國國內大模型能達到Sora水平嗎?權威解讀來了

2024041417:26


[本報記者:李明會*北京報導]

伴隨著ChatGPT、Sora、Figure01不斷引發全球關註,人工智能(AI)的驚人叠代速度不斷擴展著人們的想象空間。

中國正發出擁抱新一輪科技和產業浪潮的新信號,發力以人工智能為引擎的新質生產力。

自2017年以來,人工智能多次被寫入《政府工作報告》。2024年兩會期間,「人工智能+」首次被寫入《政府工作報告》。報告提出,深化大數據、人工智能等研發應用,開展「人工智能+」行動,打造具有國際競爭力的數字產業集群。

問題隨之而來,作為人工智能發展的核心引擎,國外的大模型不斷引爆國內輿論場、刷新大眾認知,我們的國產大模型還能彎道超車嗎?今年是大模型應用元年,在現實的不同場景之下,大模型又將與產業擦出什麽樣的火花?

4月13日晚間,中央廣播電視總臺財經節目中心《對話》欄目播出了新一期節目《AI+未來大猜想》。四位企業家——360集團創始人周鴻祎、國產大模型獨角獸智譜AI CEO(首席執行官)張鵬、人形機器人初創公司九光智能創始人徐誌根、廣藥集團董事長李楚源,以及三位財經媒體代表——《華夏時報》執行總編輯張誌偉、《中國企業家》雜誌副總編輯何伊凡、《財經》雜誌副主編朱弢,和中央電視臺主持人靳強一道共同探討人工智能的技術發展、商業化路徑等話題。

對於上述兩個問題,本文擷取了相關節目要點。

* 大模型做「小」也能彎道超車

靳強:OpenAI發布Sora,掀起新一輪對人工智能的討論熱潮,國產大模型能達到Sora的水平嗎?

張鵬:Sora確實令人驚艷,但我們仔細研究了它的技術報告之後,發現它並沒有外界看起來的那麽新奇。Sora運用到的仍是已有的技術,只不過OpenAI把這些技術綜合起來從工程上進行了優化,做到了之前的人沒有做到的事情。

我覺得,國產大模型能否做到Sora這種水平就是一個資源和時間的問題。因為Sora本身還有很多創新的技術大家還在研究,我也不敢特別準地去預測需要多少時間,但我相信應該不需要太久。

張誌偉:周鴻祎先生在今年兩會期間接受《華夏時報》記者采訪時曾表示,中國大模型的水平相當於美國GPT-3.5的水平。如何做出這個判斷?

周鴻祎:首先,我認為有差距是必然的,知道差距是多少,剩下的就是追趕問題。

我現在說話比較謹慎,你說大了,別人說你自卑;你說小了,別人說你自大。按照刷榜的成績,國內的模型早就超過了GPT-4了。但真正用一用,我覺得國內的大部分都達到或者超過了GPT-3.5的能力,全世界也就只有中國有這個能力。

如果GPT-4是100分的話,GPT-3.5差不多應該有75分到80分,我認為這個速度就很快了。

其次,美國也不是全面領先,美國真正在人工智能領先的公司,我認為就兩家,軟件是OpenAI,硬件是英偉達。

我認為,大模型比光刻機、芯片的難度要低很多,因為畢竟是軟件,但未來是要奔著AGI,也就是通用人工智能去的,這塊的挑戰就是算力。

但如果把大模型越做越小,走垂直化、產業化、企業化、場景化的道路,可能不需要萬億、千億的參數,只需要百億的參數,再加上一些私有的核心數據加持,在一個垂直單元上是可以超過GPT-4的。這就對算力的要求就降到很低,可能有十張消費級顯卡在一個場景就能用起來,非常適合我們國家,這也是我們彎道超車的一個場景。

我們有這麽多的工業門類,國家這麽重視製造業的數字化轉型,如果中國企業都用上了這種小規模的大模型,在自己的場景上讓大模型跟業務相結合,其意義不亞於我們在超級AGI上追趕國外。

* 大模型與產業的結合:小切口,大縱深

張誌偉:周鴻祎先生說過,今年是大模型場景應用元年。關於大模型如何與產業相結合,你提出了一個理念,叫「小切口,大縱深」。能不能展開聊聊?

周鴻祎:我們去年從to B模式中找到一些方法論。

比如,要給醫療機構做一個醫藥醫療大模型,必須把醫療進行場景細分——在裏邊找出50到100個場景,並對每個場景分析,看看文章生成、情感判斷、內容翻譯等大模型最常見的功能能不能發揮作用。

能不能做這個大模型取決於兩個因素:一是場景下有沒有數據知識,因為沒有知識、光有場景,訓不出大模型。二是看大模型的容錯度,因為大模型最致命的就是「幻覺」,如果某個場景中不能承受幻覺風險,那這個場景就不能用到大模型裏。

所以我主張要在企業用大模型不要一下子宏大敘事,而是在內部業務鏈條,或在外部產品功能中,選取兩到三個場景,用大模型賦能。如果能取得成績,我認為就已經是很大的進步了。所以,我談的「小切口」,就是剛開始寧可保守一點,積小勝於大勝。

而「大縱深」是什麽概念呢?大模型像發動機,現在大模型廠商在造世界上最牛、最快的發動機,但是B端企業要的不是發動機,而是一輛車。所以,我們要找到一個底盤,把發動機裝上,再給它裝上外殼、座椅,最後交付一輛車,企業才能用。

2023年,中國有上百家公司在做大模型,魚龍混雜,泥沙俱下。今年就消停很多了,因為很多企業知道,有些特別難的事自己也做不了。據我了解,現在的大模型廠商紛紛轉型,往產業方向走、往垂直方向走。

張鵬:通用大模型的能力提升所衍生的能力,能讓我們去尋找到「大模型原生的應用」或者「大模型原生場景」。但是在這個過程當中,技術需要發展,產業也需要落地。打個比方,現在我們造出內燃機了,不能說我想造飛機,內燃機不能用,我不管了,我要造噴氣發動機去。既然內燃機可以造出汽車,那就先把汽車造出來,我覺得這是不矛盾的一件事情。---[責任編輯:孟俊蓮*主編:張誌偉/來源:華夏時報]