GPT-4「變懶」bug被修複,價格暴降80%!OpenAI連更5款新模型,性能狂飙
【新智元導讀】昨夜,OpenAI一口氣連更5款新模型。GPT-4 Turbo變懶問題修複,代碼生成能力史詩級加強。另外,多款模型價格大幅暴降。
GPT-4又雙叒叕變強了!
今天,OpenAI正式發布了更新版的GPT-4 Turbo——gpt-4-0125-preview。
不僅大幅改善了模型「偷懶」的情況,而且還極大地提升了代碼生成的能力。
與此同時,OpenAI還發布了一系列模型和API更新,總體來說就是「更強的性能,更低的價格」。
- GPT-3.5 Turbo更新——gpt-3.5-turbo-0125。輸入價格大降50%,輸出價格下降25%。性能上也有升級。
- 「迄今爲止最強」的審核模型text-moderation-007,幫助開發者有效地識別有害文本。
兩個新一代embedding模型:
- text-embedding-3-small,體積更小效率更高,價格直接砍到了原模型20%!支持512維和1536維兩種大小。
- text-embedding-3-large,性能相比之前模型大幅提升,高達3072維的嵌入向量,價格是小模型的6.5倍。
最後,OpenAI還強調稱,用戶通過API傳送的數據,都不會被用于訓練新的模型。
GPT-4更強了,變懶bug修複
自從去年11月份開發者大會發布GPT-4-Turbo以來,超過70%的GPT-4 API用戶已經轉用了GPT-4-Turbo預覽版,從而能夠享受最新的知識戒指日期、更大的128k上下文窗口和更低的價格。
最新更新的GPT-4-Turbo 預覽模型——gpt-4-0125-preview在執行任務(如代碼生成)方面比之前的預覽版要更強,能夠減少模型有可能出現的「偷懶」現象。
新模型還修複了一個影響非英文UTF-8生成的漏洞。
對于那些希望自動升級到最新GPT-4-Turbo預覽版的用戶,OpenAI還推出了一個新的模型名別名gpt-4-turbo-preview,它將始終指向最新的GPT-4-Turbo預覽版模型。
在未來幾個月內,OpenAI還會推出具備視覺功能的GPT-4-Turbo正式版。
GPT-3.5-Turbo喜迎「降價增效」
下周,OpenAI即將推出新版的GPT-3.5-Turbo,型號爲gpt-3.5-turbo-0125。
在過去的一年裏,OpenAI已經第三次下調GPT-3.5-Turbo的價格。
新模型的輸入價格下降了50%,現爲0.0005美元/1k token;輸出價格下降了 25%,現爲0.0015美元/1k token。
此外,模型還進行了多項改進,比如提高了按要求格式響應的准確性,並修複了一個導致非英文語言函數調用出現文本編碼問題的漏洞。
在API中使用固定gpt-3.5-turbo模型名稱的用戶,將在這款新模型推出兩周後,自動從gpt-3.5-turbo-0613升級至gpt-3.5-turbo-0125版本。
全新嵌入模型2連發:性能大漲價格狂降
OpenAI推出了兩款新的嵌入模型:體積更小、效率更高的text-embedding-3-small模型,以及更大、性能更強的text-embedding-3-large模型。
所謂嵌入(Embedding),就是將內容(如文字或代碼)中的概念轉化爲一串數字序列。
通過這種方式,機器學習模型和其他算法可以輕松理解不同內容之間的關系,執行聚類、檢索等操作。
嵌入技術爲 ChatGPT 和 Assistants API 中的知識檢索功能,以及許多檢索增強生成(RAG)開發工具提供了強大動力。
「小」文本嵌入模型:text-embedding-3-small
text-embedding-3-small是OpenAI的新型高效嵌入模型,與2022年12月推出的前代産品text-embedding-ada-002相比,性能有了大幅提升。
- 性能更強
在多語言檢索(MIRACL)的常用基准測試中,text-embedding-3-small的平均得分從31.4%提高到44.0%,在英語任務(MTEB)的常用基准測試中,平均得分從61.0%提高到 62.3%。
- 價格實惠
text-embedding-3-small遠比OpenAI之前的text-embedding-ada-002模型效率高,因此價格也大幅降低了5倍,從每千token的0.0001美元降至0.00002美元。
OpenAI不會停用text-embedding-ada-002,盡管OpenAI更推薦用戶使用新模型,客戶仍可選擇繼續使用上一代産品。
「大」文本嵌入模型:text-embedding-3-large
text-embedding-3-large是OpenAI的新一代大型嵌入模型,能夠生成高達3072維的嵌入向量。
text-embedding-3-large是OpenAI目前性能最強的模型——
與text-embedding-ada-002相比,它在MIRACL上的平均得分從31.4%提升至54.9%,在MTEB上的平均得分從61.0%提升至 64.6%。
text-embedding-3-large的價格定爲0.00013美元/1k token。
靈活調整嵌入向量
相比于小型嵌入,大型嵌入的存儲和檢索,如放置于向量存儲庫中,往往需要更高的成本,也消耗更多的計算資源、內存和存儲空間。
OpenAI的兩款新嵌入模型均采用了一種特殊的訓練技術,使得開發者可以在嵌入的使用成本和性能之間做出權衡。
具體來說,開發者可以通過設定dimensions API參數來有效縮短嵌入向量的長度(也就是去掉數列末端的一些數字),而這樣做不會影響嵌入向量代表概念的核心特性。
例如,在MTEB基准測試中,即使將text-embedding-3-large嵌入向量的長度縮減到 256,它的性能仍然超過了長度爲1536的未經縮減的text-embedding-ada-002嵌入向量。
這種做法極大地增加了使用上的靈活性。
比如說,當開發者需要使用一個只支持最大1024維度嵌入向量的向量數據存儲時,可以選擇OpenAI性能最佳的嵌入模型text-embedding-3-large,並通過設置dimensions API參數爲1024,從而將原本3072維的嵌入向量縮減下來,以較小的向量尺寸爲代價換取了准確度。
迄今最強的內容審核模型
OpenAI提供的免費內容審核API可以幫助開發者識別可能有害的文本。
作爲OpenAI持續安全工作的一部分,OpenAI發布了迄今爲止最強大的內容審核模型text-moderation-007。
此前的text-moderation-latest和text-moderation-stable,也將重新指向這個新模型。
API後台更新,更好的API密鑰管理
OpenAI正在推出兩項重要的平台升級,旨在爲開發者提供對他們的API使用情況更清晰的洞察,並加強對API密鑰的管理。
首先,開發者可以直接在API密鑰頁面設置不同的密鑰權限。
舉個例子,用戶可以爲一個密鑰配置只讀權限,以便用于內部的跟蹤數據面板,或者設置爲僅限訪問某些特定的接口。
其次,一旦開啓了密鑰使用跟蹤功能,使用儀表盤和數據導出功能就能夠提供基于每個API 密鑰的詳細使用指標。這樣一來,只需爲不同的功能、團隊、産品或項目分配獨立的 API 密鑰,就可以輕松地監控到各自的使用情況。
在接下來的幾個月裏,OpenAI計劃爲開發者提供更多便利,讓他們能夠更好地監控 API 使用情況並管理 API 密鑰,這一點對于大型組織來說尤其重要。---[新智元報導*編輯:編輯部/來源: 新智元 ]
參考資料:https://openai.com/blog/new-embedding-models-and-api-updates