01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

對話科大訊飛:不賺錢是 ChatGPT 的問題,不是大模型商業化的問題-(1)

2023102518:06



這波大模型浪潮里,科大訊飛是一個非常有意思的玩家,主要有兩個原因:

第一當然是因為模型的表現出乎預料。最初很多人並不看好訊飛在內的「老」一批 AI 企業,但在訊飛星火大模型 1.0 和 2.0 發布後(5 月 8 日和 6 月 9 日),業內風評有了明顯的改觀。

引用企服投資人鄭立濤的觀點,在當時(6 月中旬)國內已經發布的大大小小几十個大模型里,訊飛星火 2.0 是能力最強的一個,雖然與 ChatGPT 還有差距,但進化速度非常驚人。

第二則是訊飛對大模型發展路線的判斷。這幾次發布會有一個細節很值得玩味,在 5 月 8 日的發布會上,董事長劉慶峰預言了年內大模型和產品升級的關鍵里程碑。6 月 8 日和 10 月 24 日,訊飛如約而至分別發布了 2.0 和 3.0,能力也基本符合此前的預估。

這些因素,讓我們對 10 月 24 日發布的訊飛星火 3.0 和其背後的有了諸多好奇:

        1.訊飛星火 3.0 的表現能力究竟如何,是否真的追上甚至超越了 ChatGPT 的水準?
        2.在這麼短的時間內做出高質量大模型並快速迭代,訊飛的「絕活」到底是什麼?
        3.科大訊飛為什麼能在半年前精準預測訊飛大模型的發展路徑?
        4.科大訊飛是怎麼看待大模型賽道接下來的演進方向,以及商業化這個產業關鍵問題?

帶着這些問題,極客公園對話董事長劉慶峰和研究院院長劉聰。近兩個小時的對話里,大模型業務的掌舵者,回應了關於產品、產業的一系列問題。

對於訊飛發展大模型的優勢,他們給了一個很有意思的答案。過去十年,的技術積累的核心在於語音、語義的處理,早在 2011 年便承建了語音及語言信息處理國家工程實驗室,「我們提出讓機器像人一樣能聽會說,這一次認知大模型本質上是一次對話式的通用智慧的湧現,語音和語言的核心能力是一個基礎條件。」

以下是對話全文,由極客公園整理。

「訊飛星火 3.0」如期而至

問:科大訊飛在第一次發布基礎大模型的時候就定了明確的升級版本的時間點,咱們內部是怎麼決定這些時間點的?

劉聰:定這個東西肯定不是拍腦袋,當時不了解訊飛的人可能在看笑話,但目前證明,基本上每個時間點都是實現,甚至是超預期實現的。

因為首先,我們對技術實現的每一個環節非常清楚。每次我們的升級中,都是「1+N」,在每次升級「1」時,我們都要相應地升級「N」。也有一些臨時新增的情況,比如過程中發現代碼的提升符合預期甚至超出預期,那就專門做一款代碼應用 iFlyCode。

其次,我們內部 AI核心技術和業務之間邏輯是對齊的。在過去的多年中,我們在 AI 領域經歷了從技術驅動到價值、應用場景驅動的轉變,以及的確實現了許多 AI 產品的落地。當然,在這個過程中我們也遇到了一些「坑」。

技術預判,訊飛雖然是去年 12 月 15 日才啟動了「1+N」的攻關,但訊飛在自然語言處理領域已經有十多年的經驗了:超腦計劃、認知權重、語音和語言、國家工程實驗室,這些都是我們的積累。

我們很早之前就跟客戶對接了「N」的需求,只是當時沒有大模型,我們只能做一些認知方面的內容,例如醫療方面、司法 206 系統等,所以那個時候,「N」的效果受到了限制。現在大模型來了,就意識到,將大模型應用於「N」,價值就會顯現,這些需求一下子就突破了,比如作文批改和司法大模型的案例。

之所以能立這個 flag,是因為既有技術邏輯,也有我們講的這個技術落地和產品和場景的邏輯。

再一個原因是,我們的核心團隊掌握了這些技術,已經知道技術應該怎麼跟產品對接,這是訊飛最寶貴的力量。是個系統性工程,需要算法、工程、平台、多模態……各個方向的協同,依託於訊飛研究院這樣一個平台團隊,沒有內耗,大家一鼓作氣往前走。

要補一句就是,雖然 flag 立在那,但是客觀來說完成得並沒有那麼輕鬆。每次快開發布會時,都處於緊急上線的狀態,實際上這個目標還是有挑戰性的。然而,有這樣一個團隊存在,再加上我們之前對 AI 的積累和理解,我們對達到 GPT4 這個水平非常有信心。唯一令人擔心的是我們需要花費多少時間來實現這個目標。



科大訊飛此前公布的年內升級關鍵里程碑

問:過去做 AI的積累,對做大語言模型有多大幫助?

劉聰:首先,訊飛已經做了很長時間的語音、圖文、圖像等方面的研究和開發。在自然語言處理領域與語音識別、圖像識別不同的是,NLP 不是一個定義清楚的問題,不是說我輸一條語音,識別出結果,就可以判斷準確率是多少。

比如在醫療領域中,輸入一段病歷,判斷一種疾病,或者輸入一個疾病,判斷用藥是否合適等。這些問題都需要單獨進行定義。因此,如何將自然語言理解的任務與實際場景相結合是一個非常重要的問題。在這方面,訊飛已經非常熟練了,包括算法本身以及其他的系統,這套東西已經可以完全遷移了。

第二是,模型調參這件事情是相對通用的,這是深度學習之後,包括 Transformer 帶來的統一的語音、圖像、自然語言理解。訊飛是中國最早從事深度學習的企業之一,我們在 2012 年就上線了系統。綜合來看,我認為對於深度學習這個領域,訊飛是國內理解最深刻,延續到今天也自然而然的。

問:3.0 發布面向教育、醫療這類領域的產品。不同產品背後的技術有沒有本質區別?還是只是訓練的數據樣本不同?

劉聰:現在我們講大模型的時候,不是單純就一個模型,它有插件、有知識庫,還有一些配套的能力。肯定不是大家想象的那麼單純,換一波數據訓一下就結束了。它是一整個配置,還是比較複雜的。

3.0 後,訊飛星火下一步怎麼走

問:您怎麼看大模型下一步的進化方向,目前來看挑戰會集中到哪裡?

劉慶峰:我認為有兩個進化方向。首先是大模型,這需要更大的模型參數來支持。我們需要戰略支持,訓練數萬億浮點參數,以應對基本盤。



第二個方向是構建每個人的 AI 助手,實現個性化的 AI 人設。其中一個重要的應用是主動問答,特別是啟發式引導式的提問。這樣可以將 AI 應用於更深入的行業場景,我認為這是核心主流。

我們還需要將大型模型與各個行業場景進行更深入地定製和服務,將大型模型的多模態能力和後台知識學習表達能力與各個場景深度融合。我們可以將大型模型作為核心,連接整合各種 AI 技術,為解決方案提供支持。

問:您提到真正的通用大模型是一個生態。訊飛星火大模型生態的最終形態是什麼樣子?劉聰:完整來講,生態其實是「1+N+X」,「1」是核心的底座,「N」是訊飛自有賽道的自有產品,「X」是生態。它們之間的關聯是,底座本身的提升會帶來「N」的提升,也帶來「X」的提升。

大模型生態有兩個特點,第一發展得更快,第二各種層次的不同應用,最終組成一個很大的(生態)。站在終局來講,類似 PC 時代的 Wintel。未來以大模型為底座衍生出一堆的行業模型、新生應用,甚至很多原來的應用要進行升級,那麼這是一個生態的競爭。我相信當你的大模型體量達到一定程度,至少是可以持續進步的。這個未來會肯定不會有那麼多家,它其實也是一個生態的極限。

問:訊飛大模型面向公眾開放已經有一段時間了,可不可以透露一下用戶的數量大概多少,後期考不考慮收費以及收費標準大概是什麼樣的?

劉慶峰:首先我們在今天上午提到了一個事實,從 9 月 5 日開始到現在,訊飛星火的各類用戶已經達到了 1200 萬,這個增長還是相當不錯的。今天上午我們列出了一份 PPT,其中有很多深度用戶在短短兩三個月內使用了一兩千次,解決了很多問題。

第二個數據是關於國內各家公司的比較,他們都在討論誰的用戶多誰的用戶少,使用了什麼數據來證明。對於我們來說,我們主要關注的是與大模型直接相關的應用。我們的開發者團隊數量大約有 17 萬多人,根據我們所了解到的各家數據,我們的開發團隊是最多的,並且明顯超過第二名。

其中,超過 10 萬人是企業級的開發者團隊,還有 7 萬多人是個人開發團隊。其中,大約 1.8 萬人是專門從事小助手的團隊,剩下的人則是使用 API 的小助手團隊,他們不需要進行技術開發就能製作各種應用。所以從個人用戶數來看,我們有 1200 萬用戶,開發者團隊數則超過了 17 萬人,這在業界可以說是最好的。至少從公開的數據來看是這樣的。

具體的商業模式方面,星火目前還是免費的,雖然我們也看到了很多商業機會,但我們認為還是應該先深入挖掘這些場景。

另外,對於企業來說,根據它們的需求不同,它們對訓練的價值也不同。包括我們的代碼,我們更希望推動一種模式,就像合同能源管理一樣。在使用之後,我們可以共同建立一個績效管理平台,共同形成對代碼量和代碼質量的認知。然後,我們產生的新增效益可以給行業帶來增量價值,大家可以在合作中進行分潤,這樣才能取得更遠的發展。

問:發布會上您用了「遙遙領先,如期而至」這樣的字眼,有一種破釜沉舟的感覺。所以現在訊飛內部投入了多少資源做這件事?商業化有沒有時間表?

劉慶峰:我認為我們在制定時間表和里程碑時,並沒有給自己留下退路,因為這是我們內心深處的夢想和追求。我們沒有明確說要遙遙領先,但結果卻顯示我們確實遙遙領先。我們側重於三個方面,而不是泛泛地談論這個問題。

就代碼能力來說,我們在 2018 年測得的代碼能力是 61 分,現在已經提升到了 62 分。國內公開測試中,第二名的分數也沒有超過 40 分,所以可以說我們確實遙遙領先。

在數學能力方面,我們在高考後進行了測試。我記得當時網易作為第三方進行了測試,但他們並沒有與我們聯繫。他們測試完後發現,他們拿到了 5 道或 10 道數學題,而我們當時做對了 5 道,實際上是 6 道,其中有一道是有爭議的。其他國內大型模型除了 1 家做了 4 道或 3 道題外,其他都是 0 分。所以可以說我們在數學能力方面確實遙遙領先。

除此之外,在醫療領域我們只有在結果出來後才會提到醫療。雖然大家可能覺得醫療領域的差距不大,但我們通過數據分析發現,我們的中文模型超越了 GDP 的 3.5 倍,而英文模型也相當出色。

雖然我們並沒有說自己遙遙領先,但我們與其他公司在某些方面確實存在差距。例如,快速訓練小規模數據和小樣本,複雜推理,多模態綜合使用以及處理長文本等等,這些都需要更大規模的模型。