GPT-4o實測:離「未來已來」還有一段路
沒有事先張揚的AI搜索,而是ChatGPT-4o,一個新版的、免費開放的GPT產品。
昨晚(矽谷時間周一10時),Open AI 搶在Google I/O大會之前召開了發布會,發布了一個名為ChatGPT-4o(o=omni,即「全方位」的意思)的全新版本。
四個亮點:
1)免費:ChatGPT-4o將免費開放給所有用戶; 2)實地互動:把實時演繹到了極致,按演示內容,AI可以通過攝像頭、收音孔和麥克風,實時查到圖像、聽到聲音,並對獲取的信息進行; 3)擬人:可以模擬人的情緒,可以實時讀懂人的情緒,在情緒層面與人互動; 4)融合:發布首個電腦客戶端,不再只有網頁版,可以與電腦深度融合,可以直接針對電腦裏你瀏覽的網頁信息、正在處理的辦公內容以及隨時想問的問題進行解答。
發布會的內容很炸裂。
截至發稿前(5月14日晚21時),我對ChatGPT-4o進行實測:
實測:直到本文發布前,作為GPT4的付費用戶,目前白熊觀察員在ChatGPT的App上可以使用ChatGPT-4o,但此模型實際上仍然只具有GPT4的能力,發布會所有多模態功能均未落地,實際效果有待進一步觀察。
還是那句老生常談:人們常常高估一項新科技的短期價值,低估它的長期價值。
與目前鋪天蓋地的「顛覆」之聲不同,我認為存在四個可能問題,可能導致我們在短期內都不可能流暢地使用到演示視頻裏那種黑科技。
一是算力與能源問題。AI超能力有效落地,背後涉及資源分配平衡問題。
AI能力的背後是算力資源,再底層來看就是能源,ChatGPT4發布以來,實際表現的能力一直有波動,有許多分析指出,這與Open AI本身長期緊張的算力資源有關。
白熊觀察員實測了ChatGPT 的iOS App,盡管發布會顯示的是功能會逐漸開放,但目前功能上,我們體驗到的就是一個與GPT4沒有區別的語音模型,關鍵的多模態能力尚未開放,也不具備在對話中隨意打斷GPT的能力。據業內人士告訴白熊觀察員,目前看GPT-4o模型在運行速度上有顯著提升。
我直接問了GPT-4o,不過對方回復是,通過攝像頭的實時連接功能目前尚沒有時間表。
事實上,GPT4推出之後,Open AI就一直飽受算力資源緊缺的困擾,許多跡象均體現了這一點。例如,GPT從語音功能開始,各項新產品的落地,均有較長的延時,由於GPT的用戶規模遠超其它同類產品,這使用Open AI支撐新產品應用所需要的算力資源乃至電力等能源也遠遠超過其它AI企業。
業內人士報料,GPT4turbo發布之後,普及到所有付費用戶也花費了較長時間,同時Open AI還較為雞賊地混用了3.5和4.0的不同模型能力。
(免費賬號尚無法使用GPT-4o)
另外,關於GPT-4o的免費問題,目前我用新賬號登錄Open AI官網,可以免費使用的仍然只有GPT3.5,GPT-4o的免費版本暫進還沒有出現。一位從事各類AI應用賬號銷售的朋友告訴白熊觀察員,目前他註冊了一批GPT免費賬號,只有一個顯示可以使用GPT-4o,其余均沒有此功能。由此可見,這一功能的普及尚需時日。
二是網絡環境帶來的各種延時與隔絕。
發布會稱,反應速度可以達到232毫秒~320毫秒,但今天我作為付費用戶使用體驗來看,實際上反應速度仍然需要3秒左右,發布會的無縫連接似乎仍然太理想了。
這應該與我所處的網絡環境有關。但是,從短期來看,不同國家網絡環境不同帶來的速度隔絕,恐怕需要很長時間才能解決,短期內看,GPT-4o這樣的模型,不太可能變成一個本地部署的小模型,網絡環境將極大影響「全方位」模型的體驗。
試想,如果你不是處在矽谷這樣的網絡環境,而是處在亞馬遜叢林、非洲或者太平洋島國上,或者在遠洋船舶或飛機上,網絡環境都將面臨著巨大的不確定性,這將給「全方位」的多模態大模型帶來巨大的挑戰。
三是AI獲取最新信息的問題。
AI真正要實現人機之間的無縫交互,有一個關鍵門檻,就是如何實時獲取準確地外界最新信息。此前Open AI釋放出煙霧彈,稱將發布AI搜索產品,可惜並不存在這一產品。但從行業角度來看,AI搜索非常重要,這是給AI及時補充最新信息的關鍵技術。目前的所謂AI搜索產品,在信息篩選的準確性,以及對長尾信息的遺漏上都存在問題,Open AI如何解決此類問題,值得關註。
(給出了借誤答案)
(終於答對了)
目前測試來看,ChatGPT目前對於最新的資訊信息的更新非常不及時,我幾次對話中請GPT給出ChatGPT-4o的相關信息,它給出的信息並不準確。
對最新信息的獲取、篩選和掌握,恐怕將影響模型落地應用效果的上限。
四是復雜的國際環境帶來的政策問題。
短期內,逆全球化現象在加劇,從行業視角來看,這對於人才流動、AI硬件供應鏈、國際合作與技術共享等都會產生較大的阻礙。
除了國際政治因素以外,各個區域的法律及倫理因素,也對AI應用的落地產生很大的挑戰。以ChatGPT為例 ,除了GPT-4o之外,最近有個很重要的更新,就是Memory(全局記憶)功能普及到所有GPT4用戶,這一功能的目的是讓AI能夠全面記住用戶的信息,但這背後也存在用戶有的隱私安全等問題,因此基於不同地區法律法規的不同,歐洲和韓國的用戶將暫時無緣這一功能。
目前GPT的電腦客戶端就在嘗試與電腦的融合,未來,GPT必然會與更多的智能設備融合,沒有記憶功能,GPT與人的互動體驗恐怕很難保證。
除此之外,不管是GPT還是Claude或者其它AI大模型,目前幾乎所有的AI應用都主動選擇僅向全球部分區域開放,總有一些區域在開放範圍之外。
不能廣泛地在全球各地應用,也不能廣泛地從全球獲取訓練數據,這對於AI大模型泛化能力的進一步提升,恐怕也是抄戰。
上述問題,恐怕是AI大模型產品短期內普及的挑戰,一切都還需要是一步觀察。---來源: 鈦媒體-