01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

李開復 :最新預訓練模型Yi-Lightning超越GPT-4o,中美頂尖模型只差5個月

2024101717:17



(圖片來源:钛媒體編輯林志佳拍攝)

“前一陣聲稱國內六家大模型公司裏有幾家放棄了預訓練,我們正式辟謠,零一萬物絕不放棄預訓練,而且我們的預訓練做得又快又好。”

10月16日上午,面對市場的猜測和質疑,零一萬物創始人李開複開宗明義公布這段話,並宣布推出新的旗艦預訓練模型Yi-Lightning“閃電模型”。

據李開複介紹,在國際權威盲測榜單 LMSYS 上,Yi-Lightning 超越 OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet,排名世界第六,中國第一。他還稱,Yi-Lightning是“頂級模型白菜價”,在推理速度和價格上,Yi-Lightning 的最高生成速度提速近四成,每百萬 token 僅需 0.99 元,且該定價仍有利潤。

“它是第一個在國際權威達到非常高排名、打敗多數的美國大模型,成爲首度超越全球頭部的 OpenAI GPT-4o的中國大模型。Yi-Lightning 閃電模型不但模型性能世界一流、推理非常快速,而且價格非常低,不論是App調用、還是企業應用場景調用,都是非常適合的。”李開復表示。



會後交流時,李開復向钛媒體App強調,很多人問中國的預訓練是否落後美國?我們也坦誠中國是落後美國,但有人說落後十年、二十年,今天我們可以用非常精確的數字來算,GPT4o在5月做出來的模型,我們在 10 月的今天已經把它打敗了。如果真的算中國趕超美國有多遠的距離,至少,零一萬物離OpenAI的模型,只差5個月。

據悉,零一萬物(01.AI)成立于2023年5月16日,致力于打造全新的 AI 2.0 平台與AI-first生産力應用的全球化公司,由創新工場董事長兼CEO李開複創立,並擔任零一萬物CEO。核心團隊成員來自谷歌、微軟、IBM、百度等公司。

融資層面,截至目前,零一萬物已完成三輪融資,其中包括由阿裏領投的2.5億美元(約合人民幣18.08億元)Pre-A輪融資,估值已超過10億美元,跻身獨角獸行列。(詳見钛媒體App前文:《對話李開複:中美大模型差距越來越小,我10年不“套現”》)

産品和商業化層面,零一萬物主打國外To C(消費級)付費市場、國內To B(企業級)付費市場。

對于B端與C端的布局,李開複表示,一家大模型公司同時去做To B和To C很辛苦,需要多元化的管理方式,因爲兩個團隊的基因不同,做事方法與衡量KPI也不同。

To B領域,零一萬物目前主要聚焦國內市場,如餐飲領域的數字人方案;To C領域主要布局海外,因爲在國內To C産品的流量是一個很大的成本問題,在當下較爲挑戰的環境下需要謹慎判斷。

其中,C端領域,今年5月,零一萬物發布AI生産力工具“萬知”,可速讀60萬字《馬斯克傳》。零一萬物預計今年To C端營收預計可達 1 億人民幣。

李開復表示,“to C我們主要布局海外,有幾個理由:第一、當我們開始做零一萬物時國內還沒有合適的中文模型,我們只有在國外先嘗試,嘗試了一段就有了心得,就叠代了一個、兩個、三個産品,這些産品現在表現有些很好,有些沒有那麽好,我們也在不斷地調整中。

我們也在觀察什麽時候適合在國內做什麽樣的産品,國內to C産品的流量的成本越來越高,我們也看到了有些友商的用戶從十幾塊人民幣加到三十多塊人民幣,近來還有相當的流失,在這樣一個挑戰環境裏我們會非常謹慎,先不推出中國本土新的to C的應用,我們已有的産品還會繼續維護,

但更多的精力會在國外的土壤用更低廉的錢買到非常高質量的用戶,或者能直接把App賣出去,讓用戶來訂閱收費,這個訂閱的習慣在國外也是比較良好,主要是這幾個理由。現在當下最大的理由還是說國外做to C的産品,我們變現能力和消耗用戶增長的成本算賬可以算得過來,以後再關注國內有什麽機會可以推出。”

如今,零一萬物再度選擇優化預訓練模型,並且會上也首度公布了全新 ToB 戰略下的首發行業應用産品 AI 2.0 數字人,聚焦國內零售和電商等To B業務場景。

“對于回答的生成都是靠我們Yi-Lightning大模型,某酒旅企業GMV銷售額直升170%。

我覺得,大模型應用與其說賣模型或模型做客服等應用,最好的是能夠有一個大模型公司看到完整的用戶需求,從端到端打造一個完整的解決方案,讓購買大模型和數字人的公司能立刻看到每一使用就賺錢,用得越多賺得越多,這樣他對我們的付費意願也會增長。”

李開復直言,零一萬物to B選擇做國內,是因爲找到了一些破局的空間,比如用數字人來做零售、餐飲等,形成一個完整的解決方案,另外還有兩三個領域開始在做,但現在還不方便披露。

李開復強調,“全世界的範疇來說,to B供應商基本都是當地的,跨國的設立分公司做to B,絕對不是我們或其他的創業公司能做的,所以to B在國外就放棄了,做to B就做國內,做to B就做有利潤的解決方案,而不只是賣模型,不只是做項目制,這是我們to B的做法。”

談及成本問題,李開復稱,此次預訓練零一萬物用了2000張GPU,訓練了一個半月,花費了三百多萬美元,但成本約爲Grok的1%-2%。

李開復認爲,OpenAI是一家很厲害的公司,已發布的OpenAI o1雖然隱藏了所有中間的思考狀態,但o1將此前預訓練中的Scaling 趨勢擴展到推理,對行業形成認知改變,讓行業認識到預訓練之外,後訓練SFT(Supervised Fine-Tun-ing,監督微調)與強化訓練都非常重要,“相信很多中美公司都在向o1 方向狂奔。”李開復稱。



談及未來行業形勢,李開復強調,公司不會放棄預訓練,但這是個技術活,需要懂芯片、推理、模型、算法“如果一家公司能擁有這麽多優秀的人才,能夠跨領域合作,相信中國可以做出世界排名前十的預訓練通用模型,但由于成本比較高,未來可能會有越來越少的大模型公司做預訓練。

“中國的六家大模型公司,只要有夠好的人才,想做預訓練的決心,融資額跟芯片都不會是問題的。”李開復稱。

以下是李開復和钛媒體App等部分對話信息:

    問:模型做到“世界第六,中國第一”,同時以較低的價格推向市場,是如何實現的?

李開復:零一萬物在 Yi-Lightning 的定價上並沒有虧本。

成立第一天起,零一萬物同時啓動了模型訓練、AI Infra、AI 應用三大團隊,三個團隊成熟後,再對接到一起。零一萬物將這一模式總結爲模基共建、模應一體兩大戰略。AI Infra 助力模型訓練和推理,以更低的訓練成本,訓練出性能領先的模型,以更低的推理成本支撐應用層的探索。

我們不會賠錢賣模型,但也不會賺很多錢,而是在成本線上加一點點小小的利潤,就得到了今天 0.99 元/百萬 token 的價格。

挑選模型 API 最重要的一點,是模型性能一定要優秀,在這個前提之下才去挑最便宜的,我相信,綜合 Yi-Lightning 的模型質量和價格來看,Yi-Lightning 很可能是很多開發者最認可、最高性價比的模型。

    問:此前有消息稱,大模型“六小虎”(零一、智譜、百川、MiniMax、月之暗面、階躍星辰),其中某幾家放棄了預訓練。站在行業的角度,逐步放棄模型預訓練會成爲行業整體趨勢嗎?

李開復:做好預訓練模型是一個技術活,而且要非常多有才華的人在一起工作,慢工出細活。需要有懂芯片的人、懂推理的人、懂基礎架構的人、懂模型的人、很好的算法同學,一起做出來。

如果一個公司能有幸擁有這麽多優秀的人才,能夠跨領域的合作,我相信中國絕對可以做出世界排名前十的預訓練的通用模型,但不是每家公司都可以做這件事情,做這件事情的成本也比較高,以後有可能會越來越少的大模型公司做預訓練。

不過據我所知,這六家公司融資額度都是夠的,我們做預訓練的 production run,訓練一次三四百萬美金,這個錢頭部公司都付得起。我覺得中國的六家大模型公司只要有夠好的人才,想做預訓練的決心,融資額跟芯片都不會是問題的。

    問:零一萬物首次公布 ToB 相關矩陣,未來會進一步在 ToB 方向深耕嗎?

李開復:在國內,大模型 ToB 相對于AI 1.0 時代有不同的打法,首要任務就是要尋找少數能夠按使用情況收費的方法,而不是項目定制的方法。能得到比較高利潤率的訂單再去做。

今天零一萬物推出的 AI 2.0 數字人解決方案不是做一單賠一單的做法,它專注到用戶重大的痛點需求和盈利點,也就是一個店長或 KOL 平時做一次直播浪費最重要的資源——他的時間。

這個時間就算做一小時直播能賺到一千塊錢,也就是這一千塊錢,但如果用數字人直播就不是一小時了,可能可以做一千個小時(直播),哪怕每一個小時只能賺一半的錢,一千個小時還是可以賺五百倍的錢,這樣賬就很好算了。

如果真的能把數字人做到端到端,只要輸入公司內部的東西,選一個形象、聲音按一個鈕就開始直播,等于賣給這個企業一個印鈔機,印鈔機要收租賃費就可行。除了直播以外,我們的 AI 2.0 數字人解決方案已經跑通了更多業務場景,比如 AI 伴侶、IP 形象、辦公會議等等。

整體來看,零一萬物 ToB 整體解決方案會采取「一橫一縱」的打法。先將單個行業做深做透,進而以自身技術能力和行業積累爲基礎,凝練出標准化的 ToB 解決方案,爲各行各業的企業客戶將本提效。

    問:除了數字人解決方案,零一萬物是否還有其他 ToB 解決方案?

李開復:除了我們已經發布的 AI 2.0 數字人、API 之外,零一萬物目前還有 AI Infra 解決方案、私有化定制模型等其他 ToB 業務,我們會在近期正式對外發布,敬請期待。

    問:零一萬物在海外推出 ToC 産品,國內陸續推出 ToB 産品,當前在 B 端、C 端的産品現狀如何?

李開復:一個大模型公司同時做 ToB 和 ToC 很辛苦,銷售方法、利潤的比例、需要多少投放才會有收入等評估體系完全不同。也需要多元化的管理方式,因爲兩個團隊的基因不一樣,做事的方法、衡量 KPI 的方法都不太一樣。我在這兩個領域有經驗,也在試著做,但也絕對不能什麽都做。

ToB 上,零一選擇做國內市場,是因爲找到了一些破局的空間,比如用數字人來做零售、餐飲等,能做一個完整的解決方案。另外還有兩三個領域開始在做,現在還不方便披露。

ToB 不做海外市場,是因爲全世界的範疇裏,ToB 供應商基本都是當地的。選擇在國內做 ToB,還要選擇有利潤的解決方案做,而不只是賣模型、不只是做項目制,這是我們 ToB 的做法。

ToC 我們主要布局海外。當我們開始做零一萬物時,國內還沒有合適的中文模型,只有在國外先嘗試,叠代了一個、兩個、三個産品,這些産品現在表現有些很好,有些沒有那麽好,在不斷地調整中。

我們也在觀察什麽時候適合在國內市場做什麽樣的産品,目前做 ToC 産品面臨一個很大的問題——流量成本越來越高。

我們也看到有些友商的用戶從十幾塊人民幣加到三十多塊人民幣,近來還有相當的流失,在這樣一個環境裏,我們會非常謹慎,先不推出中國本土新的 ToC 應用,同時已有的産品還會繼續維護,但更多的精力會在海外的土壤用更低的成本買到非常高質量的用戶,或者能直接把 App 賣出去,讓用戶來訂閱收費,那邊訂閱習慣相對成熟。

換句話說,現在現狀選擇在海外做 ToC 産品,變現能力和消耗用戶增長的成本算賬可以算得過來,以後再關注國內有什麽機會可以推出。

    問:今年5月,Yi-Large 把中美頂尖模型的時間差縮短到六個月,這次 Yi-Lightning 發布直接擊敗了 GPT-4o,把時間差甚至縮短到了五個月,你覺得之後中美大模型如何縮短時間差?

李開復:縮短時間差非常困難,我不預測我們可以縮短這個時間差。因爲畢竟人家是用十萬張 GPU 訓練出來,我們用的是兩千張 GPU 訓練出來。

Yi-Lightning 的效果是因爲團隊和社區大家都熱心聰明去使用,去理解對方做出來的東西,再加上我們自己每家的研發有特色,比如數據處理、訓推優化等等,現在這一套方法論在零一萬物已經成熟了,我們有信心把自己的創新加上我們的一些特長,在關注 OpenAI 和其他公司發布的新技術,盡快地去能夠了解這些技術的核心重要性,然後把它的能力在我們自己的産品裏面發揮出來。

我覺得這套方法保持在六個月左右,就已經是很好的結果了。如果期待破局,可能需要一個前所未有的算法才有機會。

我們千萬不要認爲落後六個月是一個很羞恥的事情,或者一定是要追趕的事情,因爲我很多海外朋友都認爲中國會遠遠落後,人家十萬張 GPU 等,我們要被甩掉三年、五年甚至十年都有可能,現在零一萬物證明了不會落後這麽多,而且這次 LMSYS 的榜單上也有其他兩家中國公司表現不錯。

---[钛媒體/作者 :  林志佳,編輯 :  胡潤峰|钛媒體AGI]