01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

OpenAI在中國國內的兩條應用之路走不通了?

2024062711:01



接到奧特曼警告信的第一時間,專註出海電商服務的大模型領域創業者高瑞麟,緊急召開了一場辦公會,商討是否需要將公司業務遷移到國產大模型上去的棘手問題。

「遷移,(擔心)用戶會不會繼續買賬;不遷移,繼續(調用OpenAI API)的話,成本、合規風險等都在提高。」



令高瑞麟陷入兩難的,是在奧特曼領導下的OpenAI的一封推送郵件。在6月25日發出的郵件中,OpenAI表示,從今年7月9日開始,將阻止來自非支持國家和地區的API(應用程序接口)服務。受影響組織若希望繼續使用OpenAI的服務,必須在其支持的國家或地區內訪問。

這也意味著,不在支持地區範圍內的中國大陸,將迎接OpenAI的「斷供」風險。需要註意的是,ChatGPT爆紅以來,OpenAI其實一直未曾開放過中國市場的服務。

國內大模型創業者李振告訴字母榜(ID:wujicaijing),當前國內想要訪問OpenAI的API,一般有兩個途徑:一是直接向OpenAI官方申請,這種方式更多適合個人開發者;二是通過采購微軟雲服務,間接接入OpenAI服務,這也是當前國內唯一的合規渠道。據李振觀察,目前微軟雲提供的OpenAI接入服務仍可以正常訪問。

通過上述兩種途徑,圍繞OpenAI的API,國內大模型玩家也由此發展出了兩大應用場景:科技大廠用以幫助訓練自己的大模型,在模仿的基礎上追求趕超效果;中小企業則用來開發落地應用,在實際使用中向客戶提供多樣性選擇。

對於更有實力和資源的大模型玩家而言,即便「斷供」政策正式生效,也可能擋不住它們繼續調用OpenAI的API的行為,「在一個全球化的市場中,很難存在徹底隔斷某一地區訪問權限的可能性,就是需要穿越多少圍欄的問題。」關註大模型投資的恒業資本創始合夥人江一說道。

A,  進入2024年,即便已經出現了一眾號稱性能媲美GPT-4級別的國產基礎大模型,但調用OpenAI技術的需求仍然存在。

在江一接觸到的合作客戶中,有人明確提出希望提供OpenAI技術選項,「面對更開放、更發散性的問答時,OpenAI展現出來的答案還是更強一些。」

這也促使一些應用開發商對不同的模型做起人為分割,簡單的問題推理,以及涉及垂類行業問答的場景,優先調用國內大模型,偏復雜推理和分析的內容,就交給OpenAI。



具體運行環節,有點類似當前業內推崇的MoE混合專家模型邏輯,當客戶提出一個問題後,借助機器學習的匹配算法,先將問題分類,從而基於分類結果匹配對應的模型服務商。但是否使用OpenAI服務,還取決於客戶是否願意為此多花錢,「充什麽樣的會員套餐,給你供應什麽樣的大模型選擇範圍。」李振解釋道。

不同於應用開發者的具體使用需求,那些同樣有著自研大模型野心的國內廠商,通過接入OpenAI技術,還能起到輔助刷榜的作用。

知名大模型測試集C-Eval就曾在官網置頂聲明,稱評估永遠不可能是全面的,任何排行榜都可能以不健康的方式被黑客入侵,並給出了幾種常見的刷榜手法,如對強大的模型(例如GPT-4)的預測結果蒸餾、找人工標註然後蒸餾、在網上找到原題加入訓練集中微調模型等等。

站在OpenAI的肩膀上,從模仿借鑒中快速趕超,則是國內大模型玩家接入OpenAI技術的更重要目的。

去年12月份,字節跳動被爆出正在研發一個名為「種子計劃」(Project Seed)的AI大模型項目,但該項目在訓練和評估模型等多個研發階段調用了OpenAI的API,並使用ChatGPT輸出的數據進行模型訓練。

此舉違反了OpenAI的使用協議,根據規則,OpenAI禁止使用輸出開發競爭模型。因此,字節旗下部分GPT使用權限被OpenAI封禁。

字節官方坦陳,內部技術團隊剛開始進行大模型的初期探索時,確實有部分工程師將ChatGPT的API服務應用於較小模型的實驗性項目研究中,但「該模型僅為測試,沒有計劃上線,也從未對外使用。」

部分國產大模型在訓練模型速度上快速起步的一大原因,同樣離不開對國外大模型的借鑒。去年11月被傳出套殼消息時,零一萬物在回應字母榜中承認,在訓練模型過程中,沿用了 GPT/LLaMA的基本架構,但需要說明的是,借鑒架構並不能跟「套殼」或者「抄襲」直接劃等號。

不過,這確實幫助零一萬物縮短了模型研發時間。去年3月,李開復正式宣布將親自帶隊,成立一家AI 2.0公司,研發通用大模型。經過三個月籌辦期,同年7月份,該公司正式定名「零一萬物」,並組建起數十人的大模型研發團隊。團隊成型四個月後,零一萬物便在11月份推出了「Yi」系列大模型產品,並借助Yi-34B霸榜多個大模型測試集。

B,  在OpenAI「斷供」危機之下,國產大模型的戰略替代價值越發凸顯。在李振看來,從經濟賬上考量,國內公司直接調用國產大模型會是更為劃算的選擇。

搶在企業遷移之前,一些追求更高收益的個人開發者,已經率先用國產模型替換掉了OpenAI。

2022年11月ChatGPT亮相後,受限於政策,一些人開始盯上國內想要嘗鮮的用戶,做起了賣號生意。當時,ChatGPT Plus官方訂閱價格為一個月20美元,國內用戶想要使用,收費一般為共享號(供4-6個人使用)一個月50元左右,獨享號一個月170元左右。

但從2023年下半年開始,隨著越來越多國產大模型的發布,加上用戶對ChatGPT新鮮感的減弱,越來越多個人開發者已經將技術底座從OpenAI換成了國產平替,訂閱價格也隨之下降,有的連續包年僅需198元。

現在,在App Store應用商店中搜索「ChatGPT」,各類相似應用程序充斥其中,ChatGtp4o、ChatGp4、ChatGp4o、ChatBPT 4.0、ChatGTB4……



如今,OpenAI的「斷供」之舉,給國產大模型廠商提供了一次搶奪中小企業用戶的遷移機會。

繼5月份字節、阿裏、百度、騰訊等掀起大模型價格戰之外,從6月25日開始,一眾國產大模型玩家又紛紛祭出了零成本遷移計劃,再次加碼性價比之戰。

截至目前,包括智譜AI、百度、阿裏、騰訊、百川智能、零一萬物、商湯科技、月之暗面等均已推出了OpenAI零成本遷移計劃。為加速用戶「搬家」,部分國產大模型還額外附送1千萬乃至1億Tokens,並配套調用、遷徙、訓練等多項免費服務大禮包。

C,  便宜,只是鼓動用戶遷移的必要條件。想要真正贏得用戶的青睞,國產大模型還需要做到更好用。

去年曾喊出史上最大降價的阿裏雲,並未能借助價格戰換來新的增長。聚焦到國內公有雲市場,阿裏雲市場份額不增反減。IDC發布的《中國公有雲服務市場(2023下半年)跟蹤》報告顯示,2023下半年IaaS市場中,阿裏雲市場占比27.1%,位居第一。但在2023上半年中國IaaS市場中,阿裏雲市場份額則為29.9%。

更可況,在國產大模型降價的同時,OpenAI們也在降價。按奧特曼的話說,「OpenAI也可以將非常高質量的AI技術成本降至接近零……」

想要增強大模型底座的產品吸引力,除了價格之外,更重要的比拼則在數據端。

2020年發布GPT-3時,OpenAI曾詳細公開了模型訓練的所有技術細節。中國人民大學高瓴人工智能學院執行院長文繼榮表示,國內很多大模型其實都有GPT-3的影子。但隨著OpenAI在GPT-4上一改開源策略,逐漸走向封閉,一些國產大模型就此失去了可供復製的追趕路徑。



此後,各家大模型拉開技術差距的重點,越來越多體現在訓練方法、數據配比、數據工程、細節參數、訓練過程監測技巧等細節之中。

即便在模型框架相同之下,不同的數據來源和數據訓練方法加持下,最終訓練出來的大模型性能依然會表現各異。

「前大模型時代,AI的主流是以模型為中心的單任務系統,數據基本保持不變。進入大模型時代,算法基本保持恒定,而數據在不斷增強增大。」在產業專家劉飛看來,相比算法和算力,數據可能是眼下阻礙國產大模型追趕OpenAI步伐的更大鴻溝,「魔鬼都藏在這些數據訓練的細節裏。」

在國內大模型紛紛跨入萬億參數時代之後,對數據采集和訓練的能力考驗再次提升。參數量的大小與最終模型呈現的效果之間,兩者「投入產出並不成正比,而是非線性的。」劉飛表示,「數據多只是一個定性,更重要的是考驗團隊數據清洗的能力,否則隨著數據增多,數據幹擾也將隨之變大。」---來源: 字母榜-