GPT-4o迷你版發布,ChatGPT殺死ChatGPT
「GPT-3.5(ChatGPT) API將在某個時刻退役——只是不確定在何時。」在The Verge的采訪中,OpenAI API平臺負責人Olivier Godement如此總結。
而如今,ChatGPT的締造者——OpenAI,率先「終結」了好大兒ChatGPT。
太平洋時間2024年7月18日,OpenAI推出了新款模型GPT-4o mini。這款新模型,是被業界稱作「做接近《Her》」的多模態模型GPT-4o的「子彈版」:尺寸更小、價格更低,但性能強勁。
OpenAI在官宣中將其稱為:OpenAI最具性價比的輕量級模型。
OpenAI X。
OpenAI創始人兼CEO Sam Altman激動得剛開場就大開香檳:我們認為,人們會非常、非常喜歡使用新模型。
Sam Altman X。
目前,ChatGPT的非企業用戶(包括未訂閱者、ChatGPT Plus和團隊版本訂閱者)即日起就能嘗鮮到這款新模型,而GPT-4o mini在下周也將對ChatGPT企業用戶開放。
OpenAI預告,在未來幾天內,支持GPT-4o mini微調的API版本也將推出。
比GPT-3.5便宜60%,比GPT-4更會聊天
在信奉「大」的Scaling Law(規模定律)成為模型訓練第一性原理的當下,貴,一直是大模型落地的痛點:API貴,使用過程中產生的推理成本更貴。
能讓Altman連吹「彩虹屁」,GPT-4o mini最關鍵的賣點,就是將奢侈品做到了地攤貨的價格:
輸入:15美分/百萬Tokens;輸出:60美分/百萬Tokens。
相對地,打響OpenAI內部模型價格戰的GPT-3.5 Turbo,價格為:
輸入:50美分/百萬Tokens;輸出:150美分/百萬Tokens。
這意味著,GPT-4o mini,比上一代的GPT-3.5 Turbo便宜了60%多。
在性能的硬指標上,GPT-4o mini在文本理解和多模態推理維度的學術基準測試中,已經超越了GPT-3.5 Turbo和主流的輕量模型,且支持GPT-4o同等多的語種。
GPT-4o mini的性能測評結果。圖源:OoenAI
與此同時,GPT-4o mini(上下文窗口為128K)不僅在長文本處理性能上優於GPT-3.5 Turbo(上下文窗口為16K),也有出色的函數調用能力,這意味著開發者可以基於這個底座,構建性能更優異的AI Agent應用。
據OpenAI介紹,在與金融科技公司Ramp的合作測試過程中,基於GPT-4o mini開發的收據費用數據提取應用,無需文本數據,只根據上傳的收據圖片,就能為用戶進行收據分類。
視聽,一直被認為是比文本和圖像更有可能顛覆現有人機交互方式的兩種模態。
脫胎於可以實時處理音頻、視頻和文本的GPT-4o,多模態理解能力也成了GPT-4o mini的殺手鐧。在大模型測評機構 LMSYS的聊天機器人競技場排行榜中,GPT-4o mini的排名超過了GPT-4。
目前,GPT-4o mini提供的API服務,支持文本和視覺兩種模態的處理,在未來,其支持的模態還將擴展到圖像和音頻。
通往AGI的奧義是,AI要更便宜
自2023年下半年起,「落地」就成了AI圈內最常提及的話題。
一個明顯的趨勢是,為了加快AI的落地,模型尺寸在變小,更輕量、更垂的模型不斷推出,模型變得越來也便宜——
OpenAI於2024年1月推出GPT-3.5 Turbo,就將Tokens輸入價格降低了50%,輸出價格降低了25%;後續的GPT-4o,也號稱速度提高2倍,但價格減半。
「我們認為,通過讓智能變得更加實惠,GPT-4o mini將顯著擴大使用AI構建的應用程序的範圍。」OpenAI指出,「自性能較弱的模型 text-davinci-003 在2022年發布以來,GPT-4o mini每Token的處理成本已經下降了99%。 」
讓廣闊的C端用戶「人人都用得起AI」,是OpenAI從2023年營收中學到的一課。
ChatGPT Plus 每月20美元的訂閱費,對大多數人而言還是不夠便宜。據調研機構FutureSearch,ChatGPT Plus截至2024年6月的訂閱收入(約19億美元),占到了2024年預計年化營收(約34億美元)的55%;而企業用戶和API服務的營收,分別只占到了21%和15%。
圖源:FutureSearch
終極目標要做AGI(通用人工智能)的OpenAI,終於開始「卷」小模型,也是為最近的行業定下重要基調。
無獨有偶,「歐洲版OpenAI」Mistral AI、最近有名的「AI鯰魚」Deepseek,也在同一天發布了模型的新進展,前者已經成為小模型的強勁標桿,而後者則是最近打響打模型價格戰的神秘選手。
從2023年開始,在通用模型層,大家要不然就是推出性能更好、價格更低的開源模型,或是把模型蒸餾、壓縮,尺寸做得更小——就是意在擴大開發者群體,讓更多人能先用起來。從2024年5月開始的國內大模型價格戰,大家紛紛把價格降到最低,道理也是同樣。
在開源和閉源兩條道路上,領軍者們都達成了一致。
在商業化落地上,2024「端側」大戰的戰火已經燃起。AI手機就已經打得激烈——無論是年初的三星S24系列,還是9月即將要出來的iPhone 16,國內的華米OV,都把AI作為今年最重要的賣點。
除此之外,還有PC、家電,各行各業的硬件產品,都等著用大模型來把自己「再做一遍」。做出體量更小、性能更強,能跑在各個終端的大模型,也是大勢所趨。---[文: 周鑫雨*編輯: 鄧詠儀/來源: 36氪]