OpenAI在中國國內的兩條應用之路走不通了？

2024062711:01

接到奧特曼警告信的第一時間，專註出海電商服務的大模型領域創業者高瑞麟，緊急召開了一場辦公會，商討是否需要將公司業務遷移到國產大模型上去的棘手問題。

「遷移，（擔心）用戶會不會繼續買賬；不遷移，繼續（調用OpenAI API）的話，成本、合規風險等都在提高。」

令高瑞麟陷入兩難的，是在奧特曼領導下的OpenAI的一封推送郵件。在6月25日發出的郵件中，OpenAI表示，從今年7月9日開始，將阻止來自非支持國家和地區的API（應用程序接口）服務。受影響組織若希望繼續使用OpenAI的服務，必須在其支持的國家或地區內訪問。

這也意味著，不在支持地區範圍內的中國大陸，將迎接OpenAI的「斷供」風險。需要註意的是，ChatGPT爆紅以來，OpenAI其實一直未曾開放過中國市場的服務。

國內大模型創業者李振告訴字母榜（ID：wujicaijing），當前國內想要訪問OpenAI的API，一般有兩個途徑：一是直接向OpenAI官方申請，這種方式更多適合個人開發者；二是通過采購微軟雲服務，間接接入OpenAI服務，這也是當前國內唯一的合規渠道。據李振觀察，目前微軟雲提供的OpenAI接入服務仍可以正常訪問。

通過上述兩種途徑，圍繞OpenAI的API，國內大模型玩家也由此發展出了兩大應用場景：科技大廠用以幫助訓練自己的大模型，在模仿的基礎上追求趕超效果；中小企業則用來開發落地應用，在實際使用中向客戶提供多樣性選擇。

對於更有實力和資源的大模型玩家而言，即便「斷供」政策正式生效，也可能擋不住它們繼續調用OpenAI的API的行為，「在一個全球化的市場中，很難存在徹底隔斷某一地區訪問權限的可能性，就是需要穿越多少圍欄的問題。」關註大模型投資的恒業資本創始合夥人江一說道。

A, 進入2024年，即便已經出現了一眾號稱性能媲美GPT-4級別的國產基礎大模型，但調用OpenAI技術的需求仍然存在。

在江一接觸到的合作客戶中，有人明確提出希望提供OpenAI技術選項，「面對更開放、更發散性的問答時，OpenAI展現出來的答案還是更強一些。」

這也促使一些應用開發商對不同的模型做起人為分割，簡單的問題推理，以及涉及垂類行業問答的場景，優先調用國內大模型，偏復雜推理和分析的內容，就交給OpenAI。

具體運行環節，有點類似當前業內推崇的MoE混合專家模型邏輯，當客戶提出一個問題後，借助機器學習的匹配算法，先將問題分類，從而基於分類結果匹配對應的模型服務商。但是否使用OpenAI服務，還取決於客戶是否願意為此多花錢，「充什麽樣的會員套餐，給你供應什麽樣的大模型選擇範圍。」李振解釋道。

不同於應用開發者的具體使用需求，那些同樣有著自研大模型野心的國內廠商，通過接入OpenAI技術，還能起到輔助刷榜的作用。

知名大模型測試集C-Eval就曾在官網置頂聲明，稱評估永遠不可能是全面的，任何排行榜都可能以不健康的方式被黑客入侵，並給出了幾種常見的刷榜手法，如對強大的模型（例如GPT-4）的預測結果蒸餾、找人工標註然後蒸餾、在網上找到原題加入訓練集中微調模型等等。

站在OpenAI的肩膀上，從模仿借鑒中快速趕超，則是國內大模型玩家接入OpenAI技術的更重要目的。

去年12月份，字節跳動被爆出正在研發一個名為「種子計劃」（Project Seed）的AI大模型項目，但該項目在訓練和評估模型等多個研發階段調用了OpenAI的API，並使用ChatGPT輸出的數據進行模型訓練。

此舉違反了OpenAI的使用協議，根據規則，OpenAI禁止使用輸出開發競爭模型。因此，字節旗下部分GPT使用權限被OpenAI封禁。

字節官方坦陳，內部技術團隊剛開始進行大模型的初期探索時，確實有部分工程師將ChatGPT的API服務應用於較小模型的實驗性項目研究中，但「該模型僅為測試，沒有計劃上線，也從未對外使用。」

部分國產大模型在訓練模型速度上快速起步的一大原因，同樣離不開對國外大模型的借鑒。去年11月被傳出套殼消息時，零一萬物在回應字母榜中承認，在訓練模型過程中，沿用了 GPT/LLaMA的基本架構，但需要說明的是，借鑒架構並不能跟「套殼」或者「抄襲」直接劃等號。

不過，這確實幫助零一萬物縮短了模型研發時間。去年3月，李開復正式宣布將親自帶隊，成立一家AI 2.0公司，研發通用大模型。經過三個月籌辦期，同年7月份，該公司正式定名「零一萬物」，並組建起數十人的大模型研發團隊。團隊成型四個月後，零一萬物便在11月份推出了「Yi」系列大模型產品，並借助Yi-34B霸榜多個大模型測試集。

B, 在OpenAI「斷供」危機之下，國產大模型的戰略替代價值越發凸顯。在李振看來，從經濟賬上考量，國內公司直接調用國產大模型會是更為劃算的選擇。

搶在企業遷移之前，一些追求更高收益的個人開發者，已經率先用國產模型替換掉了OpenAI。

2022年11月ChatGPT亮相後，受限於政策，一些人開始盯上國內想要嘗鮮的用戶，做起了賣號生意。當時，ChatGPT Plus官方訂閱價格為一個月20美元，國內用戶想要使用，收費一般為共享號（供4-6個人使用）一個月50元左右，獨享號一個月170元左右。

但從2023年下半年開始，隨著越來越多國產大模型的發布，加上用戶對ChatGPT新鮮感的減弱，越來越多個人開發者已經將技術底座從OpenAI換成了國產平替，訂閱價格也隨之下降，有的連續包年僅需198元。

現在，在App Store應用商店中搜索「ChatGPT」，各類相似應用程序充斥其中，ChatGtp4o、ChatGp4、ChatGp4o、ChatBPT 4.0、ChatGTB4……

如今，OpenAI的「斷供」之舉，給國產大模型廠商提供了一次搶奪中小企業用戶的遷移機會。

繼5月份字節、阿裏、百度、騰訊等掀起大模型價格戰之外，從6月25日開始，一眾國產大模型玩家又紛紛祭出了零成本遷移計劃，再次加碼性價比之戰。

截至目前，包括智譜AI、百度、阿裏、騰訊、百川智能、零一萬物、商湯科技、月之暗面等均已推出了OpenAI零成本遷移計劃。為加速用戶「搬家」，部分國產大模型還額外附送1千萬乃至1億Tokens，並配套調用、遷徙、訓練等多項免費服務大禮包。

C, 便宜，只是鼓動用戶遷移的必要條件。想要真正贏得用戶的青睞，國產大模型還需要做到更好用。

去年曾喊出史上最大降價的阿裏雲，並未能借助價格戰換來新的增長。聚焦到國內公有雲市場，阿裏雲市場份額不增反減。IDC發布的《中國公有雲服務市場（2023下半年）跟蹤》報告顯示，2023下半年IaaS市場中，阿裏雲市場占比27.1%，位居第一。但在2023上半年中國IaaS市場中，阿裏雲市場份額則為29.9%。

更可況，在國產大模型降價的同時，OpenAI們也在降價。按奧特曼的話說，「OpenAI也可以將非常高質量的AI技術成本降至接近零……」

想要增強大模型底座的產品吸引力，除了價格之外，更重要的比拼則在數據端。

2020年發布GPT-3時，OpenAI曾詳細公開了模型訓練的所有技術細節。中國人民大學高瓴人工智能學院執行院長文繼榮表示，國內很多大模型其實都有GPT-3的影子。但隨著OpenAI在GPT-4上一改開源策略，逐漸走向封閉，一些國產大模型就此失去了可供復製的追趕路徑。

此後，各家大模型拉開技術差距的重點，越來越多體現在訓練方法、數據配比、數據工程、細節參數、訓練過程監測技巧等細節之中。

即便在模型框架相同之下，不同的數據來源和數據訓練方法加持下，最終訓練出來的大模型性能依然會表現各異。

「前大模型時代，AI的主流是以模型為中心的單任務系統，數據基本保持不變。進入大模型時代，算法基本保持恒定，而數據在不斷增強增大。」在產業專家劉飛看來，相比算法和算力，數據可能是眼下阻礙國產大模型追趕OpenAI步伐的更大鴻溝，「魔鬼都藏在這些數據訓練的細節裏。」

在國內大模型紛紛跨入萬億參數時代之後，對數據采集和訓練的能力考驗再次提升。參數量的大小與最終模型呈現的效果之間，兩者「投入產出並不成正比，而是非線性的。」劉飛表示，「數據多只是一個定性，更重要的是考驗團隊數據清洗的能力，否則隨著數據增多，數據幹擾也將隨之變大。」---來源: 字母榜-

我要留言

OpenAI在中國國內的兩條應用之路走不通了？

拼命搶客！OpenAI背刺中國開發者，國產大模型誰能「平替」？

華為發聲、運營商力推！5G-A與人工智能融合 "移動AI時代"有望開啟

拼命搶客！OpenAI背刺中國開發者，國產大模型誰能「平替」？

華為發聲、運營商力推！5G-A與人工智能融合 "移動AI時代"有望開啟