圍剿 ChatGPT
人工智能(AI)聊天機器模型ChatGPT風潮狂飆超過百日,包括馬斯克在內的商界大佬、科技巨頭以及各國政府都已開始着手圍剿GPT。
鈦媒體App獲悉,北京時間4月25日凌晨的RSA 2023大會上,美國科技巨頭谷歌(Google)宣布推出基於Sec-PaLM LLM大模型技術的谷歌雲安全 AI 工作檯(Security AI Workbench),與微軟GPT-4版Security Copilot競爭。而5天前,谷歌CEO官宣谷歌大腦和DeepMind兩大團隊合併,組成「Google DeepMind」部門,以應對ChatGPT帶來的技術衝擊以及領導研發谷歌多模態 AI 模型項目等。
不止是谷歌,亞馬遜(Amazon)也加入到了GPT戰局,日前推出AI大模型服務Amazon Bedrock等,阻擊基於GPT-4的微軟雲全新大模型雲服務方案;億萬富翁、特斯拉CEO馬斯克(Elon Musk)日前也成立了一家人工智能公司X.AI,囤下1萬張英偉達A100 GPU(圖形處理器)芯片,目標要對抗ChatGPT和其背後的OpenAI公司。
GPT的風險問題也引起各國重視,開啟了下場調查和監管。
3月31日,意大利打響調查ChatGPT第一槍,要求暫時禁止使用ChatGPT,並對OpenAI公司展開調查;隨後法國、愛爾蘭、西班牙跟進,歐洲數據保護委員會則成立專門工作組開展調查;美國商務部下屬部門4月11日向公眾徵求意見,研究是否在新型 AI 模型發布前進行審核認證;馬斯克等科技大佬發布公開信為暫停開發 AI 模型之後,微軟、谷歌、蘋果、英偉達4月12日共同商議並制定AI相關安全協議。
國內方面,3月以來,互聯網科技大廠紛紛下場,一些前AI大佬們也重新出山,開啟「百模大戰」。阿里通義千問、百度文心一言、商湯日日新SenseNova體系、華為雲盤古、崑崙萬維「天工」和京東言犀等大模型產品陸續公布,創新工場CEO李開復、前百度總裁陸奇、美團聯合創始人王慧文、搜狗創始人王小川、前谷歌科學家李志飛等商業大咖陸續下場,加入到這場大模型競速中。
所有人都已感受到GPT帶來的焦慮,紛紛下場開啟圍剿GPT行動。
據鈦媒體App的梳理統計,自去年11月末至今,全球企業、科研機構已經公布總計超過20個大模型產品。
多位行業人士告訴鈦媒體App,目前國內類ChatGPT基本等同於GPT-3及以下的技術水平。與最新GPT-4相比,國內產品差距的主要原因與技術不強、算力不夠、產品體驗差、工程化能力弱等因素有關。
如今,為了爭奪「中國版OpenAI」席位,國內 AI 行業處於尷尬局面。如果跟隨,不一定有足夠資源做出媲美大廠的產品,如果不跟,又很容易被新進入者顛覆。因此,「重複造輪子」情況已然發生,「你有我也要有」、「人人都做大模型」時代正在到來。
OpenAI似乎也開始「滅火」。公司CEO奧特曼(Sam Altman)4月中旬表示,目前OpenAI沒有訓練GPT-5,而是要繼續優化和擴展GPT-4功能,此前消息稱GPT-5將會在2023年底公測。
國內外類ChatGPT技術布局及應用場景不完全統計(圖片來源:鈦媒體App編輯整理)
三方圍剿:大廠追趕、大咖下場、政府擔憂
誰也沒有想到,短短幾個月內,AI 就在各行各業掀起了一陣狂風暴雨。
「這兩個月GPT大模型風靡全球,遠超過去十年 AI 技術與產業的發展熱度,也使得過去二十年互聯網科技發展被取代。」一位行業人士告訴鈦媒體App,她認為這是繼2021年「AI 四小龍」(商湯、曠視、雲從、依圖)集體被美國制裁之後,AI 行業新一輪熱潮。
自去年11月發布至今,ChatGPT(Chat Generative Pre-Trained Transformer)訪問量已飆升至8.89億次,也是歷史上最快達到1億月活的應用,而且整個熱潮已蔓延至微軟、谷歌、英偉達等科技大廠,以及學術界、產業界當中。
從獨角獸到大廠,從使用者到投資人,從業界到學術界,所有對其感興趣的人士都在討論ChatGPT以及 AI 技術帶來的影響與未來發展。
不僅如此,ChatGPT還在不斷進化。今年3月初,ChatGPT的APl接口開放,允許開發者技術開發;兩周後,GPT-4問世,語言交互長足進步,具備針對文宇、圖片進行分析、分類創作等功能,使得ChatGPT成為全球使用人數最多的多模態通用大模型產品;十天後,ChatGPT又開放了插件測試,實質上擁有了自己的應用商店。與此同時,Bing必應搜索引擎和Office套件等微軟各類產品均接入GPT-4技術,使微軟的 AI 能力領先同行一大步。
最近一場播客節目中,英偉達CEO黃仁勛直言,GPT-4的突破之一是可以同時學習語言和圖像內容,就跟人類學東西一樣,閱讀圖文比只看文字更容易理解事物。
如今,GPT大模型的發展速度已經讓外界望塵莫及。所以為了防禦,谷歌、百度等科技大廠,馬斯克等商業大咖,以及各國政府積極開啟「圍剿」模式。
今年2月7日,谷歌CEO桑達爾·皮查伊(Sundar Pichai)在官方博客上宣布推出谷歌下一代 AI 對話系統 Bard。隨後谷歌展示「多重搜索」功能,並更新多個旗下App,而且砸下超過20億元投資OpenAI的競爭對手Anthropic,後者估值增至近50億美元。
3月初,Bard對外開啟測試,但效果不如外界預期,和ChatGPT的產品體驗相比有一定距離。
4月中旬,皮查伊表示,Bard將從基於輕量級LaMDA模型,升級為更大規模的PaLM模型,他表示升級後,Bard在處理常識推理和編程問題等任務時能力更強,升級版Bard很快推出。「隨着時間的推移,將出現能力更強大的模型。我在乎的不只是領先,完全掌控AI模型對我們來說非常重要。」
甚至連「OpenAI黑粉」馬斯克也下場參與競爭。
4月14日,華爾街日報援引知情人士稱,馬斯克計劃成立了 AI 初創公司X.AI,與對手OpenAI競爭。據內華達州備案文件顯示,美國X.AI公司於今年3月9日就註冊成立,目前馬斯克擔任董事,馬斯克家族辦公室主任Jared Birchall擔任秘書。
據報道,馬斯克還從谷歌的AI部門DeepMind等開挖LLM專家,目前已成功挖到約六位,其中包括高級工程師Igor Babuschkin、軟件工程師Manuel Kroiss等。
與此同時,國內互聯網科技大廠也集體下場。阿里、華為、騰訊、知乎、商湯、百度、京東、360、崑崙萬維等企業紛紛進入大模型競爭中,一把手帶隊,堪稱10年來中國科技圈最卷的一個月。
4月18日,GPT產業聯盟正式成立。據悉,該聯盟由中國移動通信聯合會、中國電信、中國移動、中國聯通、中國廣電等單位共同發起。
不過從整體水平上,國內類ChatGPT還有很大差距。
王小川卻告訴鈦媒體App,追上GPT-4或者GPT-5,中國企業不會低於兩年,可能需要3年左右的時間。周鴻禕也表示差距在三年左右。
而前Google(谷歌)科學家、出門問問創始人兼CEO李志飛告訴鈦媒體App,中美大模型的差距為16個月。他解釋稱,2022年1月谷歌發布指令學習大模型FLAN,之後的2022年10月ChatGPT發布,2023年3月GPT-4發布。中國企業目前發布的一批大模型與FLAN水平相近。
如今,ChatGPT大模型已經成為中國 AI 史上的一個重要發展目標。
華西證券研報總結了現有國產大模型兩個特徵:「一是頭部廠商主導,To B為主要模式,賦能原有優勢業務;二是均未對公眾大面積開放,未有明確的To C入口,實際水平不透明。」
曠視科技聯合創始人、CEO印奇對鈦媒體App表示,未來12個月將是AI大模型技術發展的關鍵節點。他指出,未來的一段時間,能不能有一個公司首先把大模型真的做出來,且性能真的是達到GPT-3.5,這是所有事情的起點。國內一方面要用最艱苦樸素、奮鬥的狀態來攻堅核心 AI 技術,另外中國 AI 公司想活得長,必須要把大模型商業化。
「大模型這波肯定會『一地雞毛』,因為技術這件事情還真不是『大力出奇蹟』。我認為五、六個月之後 AI 行業一定會有很多『泡沫』,」印奇對鈦媒體App表示。
同時,AI 正影響着人類工作和生活,風險如何控制似乎成為了重要課題,各國政府開啟對GPT的「圍剿」。
3月下旬,意大利數據保護局(Garante)以涉嫌違反數據收集規則為由,對ChatGPT的開放公司OpenAI展開調查,並宣布禁止使用ChatGPT,且暫時限制OpenAI處理意大利用戶數據。
4月11日,美國總統拜登(Joe Biden)已經開始研究是否需要限制ChatGPT等AI工具。美國商務部下屬的國家電信和信息管理局當天就其所謂的問責措施正式公開徵求意見,包括具有潛在風險的新AI模型在發布前是否要走認證核准程序。
同一天,中國下發《生成式人工智能服務管理辦法(徵求意見稿)》的通知,並向社會公開徵求意見。
4月13日,法國國家信息自由委員會決定對ChatGPT提出5項指控,並展開調查。同日,西班牙數據保護局也發表聲明,稱該機構已經正式對ChatGPT可能的違反法律行為展開初步調查程序。
觀韜中茂律師事務所合伙人王渝偉認為,生成式 AI 對於監管行業來說是一個非常新的事物,現在針對算法、技術等立法監管並不能完全覆蓋目前出現問題,對於監管來說是很大的考驗。難點是如何找到一條既能做好監管,又能不影響行業發展的路徑。「在具體執行中,對於 AI,立刻出台一個全面監管顯然不現實。」
就目前看,關於生成式AI的法規爭議問題主要集中在三個方面:知識產權例如版權、商業秘密保護等問題;涉及數據安全與個人信息保護;涉及數據跨境問題。
微軟、亞馬遜等國際巨頭企業亦對自己的員工發出預警,不要與ChatGPT分享公司的相關敏感信息,因為它們可能會被ChatGPT用於訓練未來的語言模型。
4月12日,在解決監管機構的擔憂後,意大利當局稱將暫停對OpenAI處理該國用戶數據的臨時限制令,OpenAI也將再次在意大利開放。
鈦媒體App詢問 ChatGPT,為什麼科技大廠、商業大佬、各國政府三方會集體圍剿GPT?
它認為主要有三個原因:一是GPT威脅到各大科技公司自身的核心技術和市場份額;二是GPT存在一定的道德和倫理問題,引起公眾的關注和質疑;三是企業內部存在利益衝突,導致科技大廠集體圍剿GPT。
算力、商業化成挑戰
算力資源是這場大模型競爭中的入場券。
「超過千億級別的大模型,它的訓練大概需要1000-2000張A100的卡,沒有2000張A100的卡,實驗都做不了。硬件成本約5000萬美金,加上人力、電力、網絡支出,一年需要5000萬美金到1億美金的投入。」崑崙萬維集團CEO方漢表示。
工信部最新數據顯示,截至2022年6月,中國算力總規模僅次於美國排名全球第二,在全球算力分布中占比26%。近5年,中國算力總規模年均增速超過25%,算力需求不斷提升。
事實上,儘管 AI 算力發展不是一個新鮮的話題,但隨着ChatGPT的崛起,基於服務器芯片的 AI 算力需求愈加強烈,在外界高需求、高關注、高壓力之下,現有的服務器瞬時算力很難支撐高達千億參數的大模型推理訓練,大模型已經遭遇算力瓶頸。
4月初,以「訪問需求量過大」為由,OpenAI暫停了一天ChatGPT付費服務註冊,並在亞洲等區域大規模清理批量註冊的OpenAI賬號。隨後有市場有人猜測,ChatGPT已有GPU(圖形處理器)芯片已不夠承載目前的用戶量,進而質疑ChatGPT的盈利模式是否持久,引發市場關注。
無獨有偶。鈦媒體App發現,4月17日下午,百度文心一言也出現了訪問需求量過大問題,顯示「當前使用人數較多,服務可能響應緩慢」。
據央視財經引述一位行業專家稱,雖然中國的數據中心已形成較大規模,但智算中心和邊緣數據中心的占比仍有待提高。據悉,中國 AI 服務器的市場規模大概400億至500億元,今年市場增速將超過30%。
根據英偉達公布的信息,訓練一次1750億參數的GPT-3需要34天、使用1024張A100 GPU芯片,同時,OpenAI可能至少需要3.24萬張A100用於日常推理,顯著高於此前訓練底層模型時的用量,以此推算,ChatGPT硬件成本達8億美元以上。
印奇則透露,要做成GPT大模型,至少得要1萬張英偉達A100 GPU芯片,硬件投入就需要20億元,中國目前可用作大模型訓練的A100芯片總共只有4萬張。
據The Information報道,包括亞馬遜、微軟、Google 和甲骨文等主要雲計算供應商都在限制客戶對雲服務器的使用,一些客戶稱租用硬件的等待時間長達數月,核心問題仍是GPU等算力芯片供不應求。儘管像微軟這樣的廠商已經在其60多個數據中心部署了數十萬張GPU芯片,用於 AI 模型的日常推理。
隨着GPT-4發布,市場普遍認為需百倍的芯片及其算力支持,英偉達(NASDAQ: NVDA)股價也隨即飆升,年初至今大漲86%以上。
不過,受2022年10月美國商務部半導體出口管制新政影響,英偉達A100及H100以上芯片不能出口給中國客戶,從而在硬件上對中國大模型發展形成鉗制。
鈦媒體App了解到,中國目前能採購的A800實測性能比A100低5%-10%,而最新應用GPT-4的英偉達H100新片,比中國特供版H800的性能差距超過60%。但目前國內擁有英偉達A100/A800的廠商只有阿里、騰訊、字節跳動等幾家科技巨頭,大部分企業對高端GPU並沒有直接採購需求,而是用更經濟的調用雲服務商的雲計算能力,或是租用GPU芯片等硬件設備。
印奇認為,中國 AI 大模型發展過程中,「缺芯」將是一大風險。他告訴鈦媒體App,AI 芯片製造(Fab)是很大的技術難點。
一位行業人士對鈦媒體App表示,由於大模型需要巨大的算力支持,現在百度缺少芯片,其正在為文心一言大量、溢價50%以上採購英偉達A100/A800芯片和服務器卡,「百度現在說有多少就要多少。去年百度採購的英偉達服務器芯片現在才發貨,現貨溢價很高,因為英偉達也在漲價。」上述人士表示。
據芯片分銷平台數據,國內A100芯片現貨市場價已經從7萬元漲至9萬元。另據財新,英偉達A800在國內也已被炒到原價2倍多,且緊俏到脫銷。
目前,國內外大模型廠商普遍追加了對英偉達GPU的採購預算,而國內廠商未來一年算力需求主要還是在訓練,對GPU的需求更高。
不過,國產 AI 芯片算力是否成為大模型「卡脖子」因素還存疑。王小川告訴鈦媒體App,中國可以購買的英偉達A800芯片,性能差距不大,目前不會成為「卡脖子」的瓶頸,尤其他對未來國產芯片技術突破有信心。
但清華大學計算機科學與技術系教授唐傑卻指出,隨着大模型訓練參數不斷擴大,國內大模型廠商在底層算力的差距將進一步放大。「英偉達H100也逐漸量產了,它訓練千億參數非常快。如果我們未來的芯片不能快速發展,差距會越來越大,目前也沒有任何機會跟他們縮短距離。」
一位行業人士向鈦媒體App直言,目前國產GPU類型芯片無法取代英偉達A100/H100,國內 AI 芯片很難跑動大模型。
商湯科技聯合創始人楊帆今年2月的一次演講中提到,國產 AI 芯片在產業落地中會遇到兩大挑戰:一是 AI 芯片與框架耦合性差,適配工作量巨大;二是鏈路長,國產芯片對 AI 場景的理解能力不強。他提及,訓練大模型常遇到「梯度爆炸」或者硬件故障造成機器過載迭機,整個系統都會跟着受到影響,以前迭機頻率是10分鐘一次。
今年3月業內消息稱,英偉達已經向台積電增加A100/H100和A800 GPU芯片生產訂單,但其生產交付周期大約為兩到三個月。這意味着,企業當下預定英偉達芯片,預計今年下半年或明年才能到貨,但屆時國內外大模型產品早已遍地開花。
除了算力之外,商業化變現也是GPT大模型發展的另一挑戰。
消費端方面,今年2月2日,OpenAI公司宣布推出付費試點訂閱計劃ChatGPT Plus,定價每月20美元。付費版功能包括高峰時段免排隊、快速響應以及優先獲得新功能和改進等,同時該公司仍將提供對ChatGPT的免費訪問權限。據媒體測算,基於1億用戶、每月20美元計算,ChatGPT年收入將超過200億美元。
同時,企業端方面,OpenAI技術與微軟業務融合不斷加深,微軟正藉助GPT技術加持,在搜索廣告、雲服務模式等領域實現商業化落地。不僅如此,消費端可以明顯感受到,當前微軟Bing已經集成GPT-4, Office和電子郵件已經集成了由GPT-4驅動的Copilot,可以大幅提升辦公效率,吸引更多微軟付費用戶。
多家券商研報認為,隨着GPT-4、文心一言等大模型逐漸優化和完善,搜索引擎、智能客服、內容創作(小說、廣告文案等)等相關應用有望率先商業化,尤其在媒體、廣告營銷、文學、教育、金融、智能汽車等領域均有望迎來變革。目前,Shopify、返利科技等多家電商相關企業開始接入ChatGPT,稱希望提升運營效率。
創新工場董事長兼CEO李開復表示,以ChatGPT為首的AI 2.0將在電商/廣告、影視/娛樂、搜索引擎、元宇宙/遊戲、金融、醫療六大領域加速 AI 的商業化潛能,進入提升生產力的應用井噴期,並提高社會生產力。他引述報告稱,預計到2032年,AIGC 全球市場規模將超過2000億美元。
不過,晨星亞洲高級分析師王凱卻表示,目前討論中國企業能否從類ChatGPT產品中獲得多少收入或利潤還為時過早,大家仍在探索應用場景,仍需要弄清楚國內類ChatGPT產品將如何商業化。
IDC中國研究總監盧言霞則指出,僅僅依靠大語言模型不會為任何公司提供持續的優勢,類似 ChatGPT 的技術目前對市場的影響也有限,而從長遠來看,許多相關的 AI 模型甚至可能變得無關緊要。很多科技巨頭花費大量資金最終可能卻無法獲得成功回報。
「要做出AI大模型,在硬件工程、算法和數據三方面,都需要專業經驗的沉澱和積累,拿到資金和硬件等資源,只是拿到了張入場券而已。」楊帆表示,產業對 AI 的理解不足是重要問題之一。
王小川告訴鈦媒體App,他認為最終科技大廠會一人推出一個模型,本輪參與的創業公司裡面可能最終只有不到5個大模型會拿到「通行船票」。
人人造大模型,但 AI 不能取代人類
4月12日,微軟宣布開源DeepSpeed Chat,幫助用戶輕鬆訓練類ChatGPT等大語言模型,用戶通過DeepSpeed Chat提供的「傻瓜式」操作,能以最短的時間、最高效的成本訓練類ChatGPT大語言模型。
例如,一個130億參數的類ChatGPT模型,只需1.25小時就能完成訓練。
這意味着,這類開源大模型商業化,正使得每個人、每家企業都能擁有自己的ChatGPT。人人造大模型的時代正加速到來。
周鴻禕向鈦媒體App進一步解釋,現在GPT技術已經開源而且擴散,這個不存在重複開發問題。「就像你可以用公有雲的服務,但很多公司也會用私有雲、自己的私有數據庫,因此每家企業都可以訓練一個私有的GPT只給企業自己或客戶。從保密和專屬需求來說,看企業根據自己的需要設置公用模式或專用模式。」
不過,這種人人造大模型是否存在實際商業化應用需求,技術風險是否存在,目前仍未知。
實際上,ChatGPT不僅讓 AI 迎來「iPhone 時刻」,而且還打開了一個 AI 算法的「潘多拉魔盒」。
可以遇見,未來藉由通用人工智能(AGI)等新技術,教育、科技、內容生產等幾乎全社會各行業都面臨着生產力和生產關係的重塑。
高盛公布的一份報告預計,全球未來平均18%的工作崗位或可由生成式AI自動化完成,約有3億個全職崗位將受影響。由於生成式AI目前還無法進行體力勞動,受影響的主要是白領工作,且對發達國家的影響將比發展中國家更大。
因此,馬斯克等千餘名業界、學界人士3月29日聯署發表公開信質問OpenAI:是否該讓 AI 替換人類的工作?是否應該發展非人類思維,讓它們最終在數量和智力上超越、淘汰井取代人類?
「雖然 AI 很多能力不斷在發展,甚至它的一些能力已經等同於甚至超過人的能力,但是 AI 也永遠不會跟人的智能完全劃等號。AI 運行還是在人類設計的這些算法,以及教它學的這些數據的基礎上,完成他的一些智能的這種理解生成動作等。它並不具備控制人類的能力。」百度CTO王海峰在4月16日一場演講中表示,他認為 AI 不會產生像人一樣的意識行為。
商湯聯合創始人、CEO徐立則表示,「AI是生產『生產力工具』的工具,它將開啟軟件開發新範式,把我們帶入『新二八定律』的時代,80%的工作由機器完成,20%的工作由人來做。」
更多 AI 行業人士普遍認為,AI 依然是一個輔助工具。
不過,馬斯克卻認為,人類文明未來面臨的最大風險之一是 AI。他認為AI 發展不受限制會帶來危險,「人工智能比核彈頭危險得多。」
實際上,過去70多年間,全球 AI 技術發展迅猛,儘管此前數據量不夠、算法不強、商業化不如預期,但如今,在ChatGPT催化下,全球 AI 行業迎來新一波狂潮。這一次,AI 算法、算力、數據「三駕馬車」同步突破,AI 技術已經蓄能完畢,所有人終於可以大展身手。
在 AI 逐漸平民化的今天,商界大佬、科技巨頭以及各國政府都開始圍剿ChatGPT,建構自己的「護城河」。
隨着市場從火熱轉回冷靜,重新回歸商業化本質,這場 AI 大模型戰爭似乎仍會持續下去。-(鈦媒體/作者:林志佳*鈦媒體深度)