萬字長文,看懂世界主要國家AI大模型進展-(3)
歐洲還有一個名叫BLOOM的大模型,發布在2020年8月。這是一個由 AI 初創公司 Hugging Face 在法國政府的資助下發起的項目,全球 1000 多名志願者研究人員耗時一年多創建的 AI 模型,旨在消除傳統大語言模型的保密性和排他性,並從一開始就嵌入倫理考量。
BLOOM有 1760 億參數,它被設計得儘可能透明,並且是第一次採用了西班牙語、阿拉伯語等語言訓練。BLOOM最大的特點在於可訪問性,任何人都可以從 Hugging Face 網站免費下載它進行研究。
BLOOM的研究人員認為,開發一個任何人都可以使用,並且性能與其他高級模型相當的大語言模型將帶來人工智能開發文化的長期變化。所以從歐洲的視角來看,這是一項致力於AI民主化的重要工作。
從 BLOOM的視角可以看出,歐洲在AI大模型上的關注重點與世界其他國家是不一樣的,開源普惠,綠色安全這一類關於SDG的詞彙一直是歐洲關注的重點。所以在AI大模型之後,歐洲大量精力其實都用在了立法上。
比如最重要的一項立法就是即將在3月底提交歐盟議會表決的《人工智能法案》。
這項法案是歐盟委員會在2021年提出的,原因是歐盟認為從跨國視角來看,各國獨立的監管措施會導致監管碎片化,進而妨礙跨境人工智能市場的形成,並威脅到數字主權。同時他們也擔心複雜的監管會抑制創新、威脅個人隱私、甚至AI一旦失控帶來的一些潛在風險。當然,最重要的是,歐盟希望通過立法的方式參與到全球人工智能的標準制定當中。
具體而言,歐盟希望將不同的AI技術根據風險水平進行分類,具體為:最小、有限、高以及不可接受。高風險技術不會被禁止,但相關公司將被要求在運營中保持高度透明。而所謂透明,其中的規則就是迫使相應的公司闡明其人工智能模型的內部運作方式。
而這項法案一旦通過,意味着將成為歐盟成員國內直接適用的法律,之後如果企業想在歐盟銷售或使用人工智能產品就必須遵守相應的法規,否則將面臨高達其全球年營業額 6% 的罰款。
但FLI認為,歐洲對其他國家的技術依賴可能阻礙歐盟參與制定人工智能全球標準的努力。
歐洲的問題在於,缺乏一個統一的大市場。
在GDP總量上,歐盟2022年GDP16.65萬億美元與中國相當;在人口數量上,歐盟2022年人口4.46億,甚至超過美國3.32億。但歐盟卻擁有28個國家,23種官方語言,再加上與美國的深度綁定,都導致歐盟在互聯網時代沒有創造出一個大型的互聯網企業,進而在數據量、雲計算、推理訓練等AI大模型相關的基礎設施上被持續拉開。
如今在AI大模型領域,歐洲已經很難組織起一場強有力的阻擊,但對於中國企業來說,歐洲仍然是一個廣闊的市場。
中國:最活躍的AI市場,愛打組合
許多人可能會認為,中國的AI大模型是從「文心一言」開始的。但「文心一言」其實只是一個類ChatGPT的產品,背後驅動它的AI大模型無論是百度、阿里、還是騰訊、華為都早有布局。
但有意思的是,中國第一個AI大模型並不來自於這些牛逼哄哄的大企業,而是2021年3月由智源研究院發布的「悟道1.0」。
可能會有人好奇,智源研究院是個什麼角色,那我告訴你,它是妥妥的國家隊。
智源研究院是科技部和北京市支持的,依託北京大學、清華大學、中國科學院、百度、小米、曠視科技等北京人工智能方面優勢企業共同建立的研究機構。
智源研究院推出的悟道1.0並不是某個大模型的名稱,而是一系列大模型的統稱。
具體包括我國首個面向中文的預訓練語言模型悟道·文源;首個公開的中文通用圖文多模態預訓練模型悟道·文瀾,首個具有認知能力的超大規模預訓練模型悟道·文匯和超大規模蛋白質序列預測預訓練模型悟道·文溯。
除了發布了諸多冠名「第一」的大模型之外,智源研究院還為中國構建了大規模預訓練模型技術體系,並建設開放了全球最大中文語料數據庫WuDaoCorpora,為後來其他企業發展AI大模型打下了基礎。
而或許是受「悟道1.0」的影響,後來幾乎所有企業,在發布大模型的時候都不止發一個,而是一串。
比如百度在2019年發布了文心大模型。和悟道AI一樣,文心大模型也是諸多模型的統稱,包括NLP、CV(機器學習)、跨模態大模型和生命計算大模型四個類別36個大模型。
3月16日,基於文心大模型,百度發布文心一言,成為中國第一個類ChatGPT產品。
華為在在2021年基於昇騰 AI 與鵬城實驗室聯合發布了鵬程盤古大模型。盤古大模型包括CV和NLP兩類大模型。其中,盤古NLP大模型是業界首個千億級中文NLP大模型。
阿里在2022年9月發布了「通義」大模型系列,包含NLP大模型AlicMind、視覺大模型CV,多模態大模型M6。其中M6大模型是國內首個千億參數多模態大模型。
目前,阿里巴巴「」通義」大模型系列已在超過200個場景中提供服務,實現了2%-10%的應用效果提升。典型使用場景包括電商跨模態搜索、AI輔助設計、開放域人機對話、法律文書學習、醫療文本理解等。
同樣在2022年,騰訊發布混元AI大模型,其中包含NLP、CV和多模態等基礎模型和眾多行業/領域模型。到今年2月初,騰訊混元AI大模型團隊再推出萬億中文NLP預訓練模型HunYuan-NLP-1。目前HunYuan-NLP-1T大模型已在騰訊廣告、搜索、對話等內部產品落地,並通過騰訊雲服務外部客戶。
到今年2月底,騰訊也開始研發類ChatGPT產品,並已成立「混元助手(HunyuanAide)」項目組。
商湯在3月14日發布多模態通用大模型「書生2.5」,擁有30億參數,其圖文跨模態開放任務處理能力可為自動駕駛、機器人等通用場景任務提供感知和理解能力支持。「書生(INTERN)」最初版本由商湯科技、上海人工智能實驗室、清華大學、香港中文大學、上海交通大學在2021年11月首次共同發布。
在此之外,京東在2月10日宣布研發產業版ChatGP—ChatJD,網易、360、字節跳動等也宣布了在AI大模型方面的布局。
可以說,目前國內有頭有臉的互聯網企業基本都擁有一個AI大模型,或者制定了相應的計劃。
而與國外企業大多專注於一個大模型不同,中國企業在大模型方面的布局並不愛單打獨鬥,而是喜歡通過一個系列來打組合拳。
另一個特點在於,與國外大模型在實驗室打磨成熟之外,中國大模型都是從產業端實戰出來的。比如阿里、百度、騰訊的大模型都會應用到廣告推送、社交平台的圖片識別,內容分發等領域。
因此在中國企業發力大模型的時候,消費端的用戶感知其實並不強烈,但當你體驗到廣告推送越來越準確,視頻平台和電商平台的猜你喜歡越來越能Get到你的點,後面都有大模型的功勞。
在大廠之外,與韓國缺少創業不同,AI大模型正在中國帶動AI大模型領域的創業風潮。
從前美團聯合創始人王慧文在朋友圈公開組隊開始,阿里VP賈揚清,創新工場CEO李開復、前搜狗CEO王小川、前京東AI掌門人周伯文、出門問問創始人李志飛等人紛紛下場創業,據「自象限」不完全統計,目前下場的大佬已有10位。
除了創業之外,中國投資機構也在躍躍欲試。
在王慧文確認下場AI大模型之後,一張真格基金合伙人戴雨森、劉元與王慧文、李志飛喝酒的圖片在網上瘋傳,被認為是AI大模型時代的標誌性照片。目前,王慧文的光年之外已經確認2.3億美元的新一輪融資,其中可能包括真格資本和源碼資本。
除此之外,在奇績創壇2022年11月舉辦的2022年秋季路演中,陸奇選擇的55個項目,其中就有16個項目與大模型相關。
可以說,AI大模型正在成為中國硬科技投資的一個新風向。關於中國ChatGPT的投資現狀,「自象限」專題《ChatGPT啟示錄》第四篇《中國ChatGPT投資啟示錄》將會具體提到,歡迎持續關注。
整體來看,從投資、創業到應用,中國幾乎是目前世界上最活躍的市場。
所以我們大可不必糾結為什麼ChatGPT沒有發生在中國,因為未來仍然大有可為。
-[文:自象限*作者:羅輯*編輯:莊顏/鈦媒體]
參考資料:
https://www.intellilink.co.jp/column/ai/2022/070800.aspx
https://bigscience.huggingface.co/blog/bloom
https://futureoflife.org/wpcontent/uploads/2022/11/Emerging_NonEuropean_Monopolies_in_the_Global_AI_Market.pdf
http://m.ce.cn/gs/gd/202303/15/t20230315_38444222.shtml