萬字長文,看懂世界主要國家AI大模型進展-(2)
韓國:只有財閥巨頭,沒有初創公司
沒想到的是,一直被日本看不上的韓國,在大模型領域反而比日本跑得更快些。
事實上,韓國是最早加入AI大模型研發的國家之一,但韓國的AI大模型這個國家的經濟一樣,只有財閥的身影,沒有初創公司的故事。目前,韓國在大模型領域的代表只有互聯網巨頭Naver和Kakao,移動運營商巨頭KT和SKT,以及通信巨頭LG。
除了財閥唱主角之外,緊跟美國步伐也是他們的一個重要特點。
比如在GPT-3的應用上,2020年OpenAI發布GPT-3的論文,韓國企業在2021年就推出了相應產品,反應速度比中國更快。這種緊跟在AI方面也是如此,2020年穀歌、亞馬遜等美國巨頭開始推出AI加速芯片時,SKT就同步推出了自主研發的AI加速芯片SAPEON X220。
韓國在芯片半導體方面的積累也放大了它在AI大模型方面的優勢。目前韓國企業正在和半導體企業積極結盟,以應對大模型發展帶來的算力挑戰。
比如2022年底,Naver就開始和三星電子合作開發下一代人工智能芯片解決方案,該解決方案基於Naver推出的AI大模型Hyperclova進行優化,目前開發已進入最後階段。
同年,KT公司也對芯片設計公司 Rebellions Inc.進行了戰略投資,這是一家位於韓國本土的AI初創公司,在專用芯片方面擁有獨特的技術。Rebellions將為KT公司優化MI:DEUM,並推動其商業化。
除此之外,KT公司還投資了AI初創公司Moreh,並計劃在今年推出一套韓國的半導體,其效率可能是現在半導體的三倍以上。KT希望通過這種方式,全面進入目前由英偉達主導的AI半導體市場。
第三點,則是韓國在AI大模型的垂類應用已經有比較多的探索。比如KoGPT在醫療保健方面的應用,Exaone在生物醫藥和智能製造方面的應用等等。
整體上看,韓國的AI大模型在基礎設施方面非常完善,比如在算力方面有三星電子,SKT等半導體巨頭;互聯網方面有Naver和Kakao這樣的標杆企業,這些特點都讓韓國能在AI大模型的發展浪潮中走在世界前列,並推出了一系列具有代表性的AI大模型。
比如前面提到,韓國最大的搜索公司Naver在2021年推出了HyperCLOVA,韓國版的 HyperCLOVA 擁有2040億參數,比GPT-3還要多290億,且其中97%使用的是韓文語料。
目前,Naver已計劃在今年上半年基於HyperCLOVA推出Search GPT(類似微軟New Bing)並在7月份推出HyperCLOVA X,這是HyperCLOVA 的最新版本。
同樣是在2021年,韓國另一家互聯網巨頭Kakao 旗下的AI研究部門Kakao Brain發布了一個基於GPT-3的KoGPT,之後Kakao Brain又將KoGPT更新至GPT-3.5,實現與 ChatGPT使用相同版本的預訓練大模型。Kakao Brain 首席技術官 Kim Kwang-seob 表示:「KoGPT將專注於開發基於 AI 的圖像創建技術和醫療保健技術。」
Kakao Brain在KoGPT之外還推出了基於人工智能的圖像生成器 Karlo,BEDIT和BDiscover,類似於stable diffusion。
2022年5月,SKT推出了基於GPT-3的聊天機器人A.的測試版,用來處理客戶的特定任務。目前,A.在韓國已經獲得了100萬用戶,並計劃在今年推出正式版。
2022年12月,LG集團的人工智能智庫LG AI Research 推出了Exaone。這是一個擁有3000億參數,使用圖像和文本數據的多模態模型,也是目前韓國參數規模最大的模型。Exaone應用在生物醫藥和智能製造方面,有助於加速抗癌疫苗和創新電池的開發。
▲ 圖源Exaone在電池產業和生物醫藥的應用
到今年1月,據韓國經濟日報報道,韓國KT公司也將在上半年推出自己的類ChatGPT產品。此前,KT公司在2022年11月推出了基於GPT-3的人工智能服務MI:DEUM,它能夠實時回答問題、總結報紙文章,並給出投資建議。KT公司目前也正在積極向韓國的金融服務公司推廣MI:DEUM。
但韓國同時也面臨許多挑戰,比如韓文在語料方面和中文、日語一樣,面臨複雜的語言體系和語料不足的問題。
HyperCLOVA的工程師提到:「韓語是一種凝集性語言,名詞後面有例子,動詞和形容詞的詞幹後面有尾音,並有各種語法性質的表達。對韓語使用類似英語的標記化已被證明會降低韓語語言模型的性能。」
除此之外,韓國產業界認為,韓國嚴格的數據使用規定阻礙了韓國初創企業收集足夠大的數據來訓練AI大模型。
韓國是目前世界上數據信息管理最嚴格的國家之一。雖然在2020年韓國通過了三大數據隱私法的修訂法案,以放寬對個人信息使用的規定,但該國對數據使用的規定仍然比其他國家更嚴格。
2021年初,韓國AI初創公司Scatter Lab上線了一款基於Facebook Messenger的AI聊天機器人「李LUDA」,但僅僅過了20天,「李LUDA」就不得不終止服務,Scatter Lab甚至為此公開道歉。
原因在於,「李LUDA」上線之後,一些韓國男性用戶將其視作性對象甚至「性奴隸」,肆意發泄自身的惡意。他們對「李LUDA」進行各種言語上的侮辱,並以此作為炫耀的資本,在網上掀起「如何讓LUDA墮落」的低俗討論。
受這些信息影響,「李LUDA」很快開始發表各種歧視性言論,涉及女性、同性戀、殘障人士及不同種族人群。「李LUDA」的問題也牽涉出韓國的個人信息保護問題,並有相關部門介入調查。
「李LUDA」的案例就像總能直擊人心的韓國電影一樣,為世界AI大模型的發展提供了更多關於倫理、道德等方面的啟示。許多人害怕AI的惡意,但AI其實本沒有善惡之分,所謂的善惡其實都來自於人類自己,這取決於你給AI什麼樣數據,就像我們教予孩子什麼樣的知識一樣。
除此之外,韓國AI大模型領域缺少初創公司的身影,且韓國對初創公司的投資也比較匱乏。
根據斯坦福大學HAI發布的 AI Index 2022,韓國初創企業獲得投資額為11億美元,僅占美國初創企業獲得投資額529億美元的2%,甚至低於以色列的24億美元。這也導致韓國在AI初創公司獨角獸方面落後於其他國家。
根據全球科技市場追蹤機構 CB Insights 的數據,截至 2022 年 12 月,美國的 AI 獨角獸數量最多,有 53 家初創公司。中國以 19 家位居第二,其次是英國有4家,但韓國卻沒有AI獨角獸公司,而即使是國內生產總值 (GDP) 低於韓國的以色列也有 3 家。
▲ 圖源數據來源CB Insights
一家專注於交互式 AI 技術的韓國機器學習技術的企業Genesis Lab Inc. 創始人兼CEO Lee Young-bok 表示,韓國公司總體上對人工智能並不友好,並補充說政府或公共組織應該更加積極地採用人工智能技術。
歐洲:只有德國在認真「搞事業」
一直以來,歐洲似乎是僅次於美國的存在,但在AI 大模型方面,歐洲並不比日本更出色,甚至處於持續擺爛狀態。
Future of Life Institute (FLI)曾在2022年11月發表過一篇報告提到:「歐洲沒有開發通用人工智能系統,也不太可能很快開始這樣做。」
FLI是美國的一家致力於減少人類面臨的全球災難性和生存風險非營利性機構,先進人工智能帶來的風險是其最重要的研究方向之一,其創始人包括DeepMind研究科學家 Viktoriya Krakovna,馬斯克也在該機構擔任顧問,並提供資助。
FLI認為,在AI大模型方面,歐洲可能會主要扮演一個使用者的角色,即通過接入其他國家開發的大模型API來開發應用。
比如芬蘭的Flowrite,一個基於AI的寫作工具,可以將輸入關鍵詞生成郵件、消息等內容。比如荷蘭的MessageBird,一個全渠道通信平台,這兩者都是在GPT-3的基礎上運行的。
歐洲在AI大模型方面確實缺少有影響力的企業,唯一一個總部位於英國的DeepMind還是由 Alphabet 全資擁有。整個歐洲,唯一擔心因為大模型落後而被世界甩開,並為此操碎了心的只有德國。
比如谷歌3月7日最新推出的多模態大模型PaLM-E,就由谷歌和柏林工業大學共同打造,目前PaLM-E擁有5620億參數,是全球最大的視覺語言模型。
除了合作研發之外,德國還擁有歐洲目前唯一一款AI大模型。
2022年4月,位於海德堡的德國初創公司Aleph Alpha發布了一款擁有700億參數的預訓練模型Luminous,大約是GPT-3的一半左右。Aleph Alpha在此基礎上訓練了聊天機器人Lumi,並計劃在今年晚些時候發布最新版Luminous-World,其參數規模將達到3000億。
作為歐洲企業,Luminous最大的特點在於更保護安全和隱私,Aleph Alpha 表示他們「不記錄任何用戶數據」。而包括OpenAI在內的大多數AI大模型需要用戶數據進行訓練(數據收集過程是透明的)。
▲ 圖源Luminous官網
除了建設大模型,德國也為歐洲薄弱的人工智能基礎設施操碎了心。
德國人工智能協會正在開展一項大型歐洲人工智能模型(LEAM) 的計劃,並得到博世、SAP、大陸、拜耳、默克等德國行業巨頭以及歐洲類似人工智能協會的支持。LEAM計劃投資3.5億歐元,從數據收集、人才培訓、基礎設施建設等方面為歐洲AI大模型的發展建立一個有競爭力的 AI 生態系統。
當然,你可以吐槽歐洲在技術和商業上的拉胯,但不能吐槽它在公共事業上的努力。