日本正以舉國之力押注主權AI
6月14日,由谷歌知名研究者David Ha和AI開創性論文作者之一Llion Jones建立的SakanaAI宣布完成Khosla Ventures、Lux Capital、NEA聯合領投的1.27億美元。這家公司成立於2023年7月,近半年融資2輪,上輪資方還包括NTT(日本電信巨頭)及索尼等。
據《朝日新聞》,SakanaAI在新一輪融資後估值約為1800億日元(11.42億美元),不到一年,成為日本增長速度最快的AI獨角獸。
「每個國家都需要占有自己的智力生產,這就是為什麽會有『主權人工智能』這個概念。它編撰了你的文化、社會智慧、常識、歷史,因此你必須拿到這些數據、完善這些數據,並擁有自己的國家情報,你不能容許其他人這麽做。
黃仁勛在2月的World Government Summit提到了主權AI。再小的國家如果要專註一項人工智能,那麽第一件事是建立「基礎設施」,將自己的文化、語言編入自己的大語言模型中。
來源:YouTube,WGS2024視頻截圖
這個道理對All in AI的日本而言是字字箴言,2023年他們舉全國之力搶跑AI賽道,各大名企訓練AI模型,巨額押註「夢之隊」SakanaAI,旨在超越中美。不僅是日本,新加坡、印度、阿聯酋等國也在大力投資主權AI。
01, 不到1年,估值11億美元
SakanaAI被稱作「東京AI夢之隊」,有著頂尖行業人才和新穎的創業理念。更為重要的是,他們是一家100%在日本註冊的公司。
SakanaAI的名字取自日文「魚」的意思,他們的logo是一簇魚群,他們旨在開發基於自然原理的人工智能,即許多小元素共同作用以產生大結果。
圖源:JAFCO
3月,SakanaAI宣布發布EvoLLM-JP(大語言模型)、EvoVLM-JP(視覺語言模型)和EvoSDXL-JP(圖像生成模型)這3種日語模型,後2者在Huggingface上可以在線試跑。從熱度來看,3類模型下載次數均未超1000次。
來源:HuggingFace
從實效來看,模型的生成能力還帶提升。作者使用其EvoSDXL-JP演示模型以日文「大和撫子」跑圖後發現,生成圖像仍存在物種、性別上的錯誤,及眼睛和腿腳顯示的誤差。在食物生成方面,模型生成效果好一些,更具美術效果。
圖1題詞:大和撫子,圖二題詞:浮世繪風格的美味食物。註:生成時輸入語言為日語。圖源:EvoSDXL-JP測試模型生成效果
但模型生圖速度很快,約為5s/張,符合其推理僅需4步,速度比現有日本模型快10倍的說法,生圖風格貼近題詞「日本浮世繪」。
短短幾月達到成效,SakanaAI團隊遊刃有余。6月,他們開始研究起新問題:「我們是否也可以使用LLM來提出更好的算法來訓練LLM本身」,如果可以,這是最少人工干預的情況下優化新算法的辦法。他們將與牛津大學和劍橋大學合作這個項目。
來源:SakanaAI Blog
SakanaAI能吸引到多種學界資源並不意外,它於2023年7月在東京成立,創始人是David Ha、Llion Jones和後期加入的Ren Ito,這三人都是業界知名人士。
左David Ha,右Llion Jones,來源:Lux Capital
David Ha是東京大學多學科博士,曾在高盛工作8年,成為Google Brain日本分中心的研究負責人,也是Google在職6年的研究科學家。他發布了多篇關於神經網絡、深度學習、圖像生成、項目演示和論文,並在ACM、ICCV、ICLR、AAAI等頂會/頂刊發表。早在2018年他就有一篇與日本古典文學深度學習相關的論文發表於NeurIPS。
David曾擔任 Stability AI的研究主管,但不到1年確認離職,同時期Stability AI高層變動,其時任COO Ren Ito也同時離職,目前兩人都在SakanaAI工作。他透露在日本創業的部分原因,一是日本尚未開發出有競爭力的大模型。二是在矽谷創業難以實現差異化。
SakanaAI的COO Ren Ito畢業於東大,是紐約大學的法學碩士及法學院高級研究員、斯坦福的文學碩士。他最先是在政界任職外交官,曾是日本外務省首席副主任,後在商界也有成就,助日本二手平臺Mercari策劃IPO,後前往Stability工作。
在Stability,他接觸到了人工智能模型生成的西方凝視和文化偏見,Ren Ito認為每種文化、每個民族、每個國家都應該建立自己的基礎模型。在日本運營SakanaAI,也算是Ren Ito得償所願。
來源:領英,Ren Ito
另一位Llion Jones是「Transformer 八子」的其中之一,他畢業於伯明翰大學,在YouTube、Google工作過,直到去年才開始創立公司。他是人工智能界有開創性貢獻的論文《Attention Is All You Need》的第五作者(每名作者同等重要),該文介紹的Transformer深度學習架構,成為ChatGPT等產品開發的基礎。在頂尖AI人才不過百余人的當下,Llion Jones坐鎮SakanaAI顯得意義非凡。
據IT Media,SakanaAI在1月融資後公布過一份創始成員名單,其中的Google含量極高,10個人裏5個來自Google的主要AI研究機構,有3名來自Stability。
David在訪談中表示,今年2月他們在網上發布招聘信息的4天內收到300分申請,有70%來自英國、美國、澳大利亞等非日本地區。
圖源:IT Media
團隊陣容華麗,因此他們成立的第7個月就拿到了3000萬美元的融資,估值達到2億美元。SakanaAI在2024年1月獲得一輪資金,除了矽谷VC Lux Capital和Khosla Ventures外,還有日本的NTT集團、KDDI、索尼集團及JAFCO集團,還包括谷歌首席人工智能官Jeff Dean、Hugging Face創始人Clem DeLang、Scale AI創始人 Alex Wang的個人投資。
那時,他們的模型還在研發階段,甚至還是一個概念。
Ren Ito介紹,他們在開發一條生成式AI的創新之路,用「自然啟發智能」的理念來實現低成本、強性能。「想象一個蜜蜂群,工蜂離開蜂巢尋找資源,他們可以相互交流優質資源的位置,優化資源利用。」
團隊給出的專業解釋是,他們的算法可以通過在組合、測試和丟棄數據時模仿自然選擇,幫助自動創建處理語言或圖像的AI模型,減少人工輸入量。他們跟OpenAI花數十億美元的訓練方法形成鮮明對比,David設想的是,「我們希望用更少的計算將時間縮短到幾天或幾周,同時獲得相似的性能水平。
官網稱,他們使用「進化模型合並」來開發兼具性能指標和穩健性的大模型。
第一個好處便是節省算力。Medium用戶Bragi分析, 「模型合並」即通過結合多個小模型的知識和能力來創建高性能模型,計算成本僅是小部分。最終生成的統一模型可以達到或超過幾個大模型的性能。
圖源:Medium
另外,這個過程類似於多個開源模型融合,類似自然進化繁衍出下一代優秀模型,無需人工幹預,且能青出於藍勝於藍。
進化模型合並有效地自動化模型構建,不僅適用於語言生成,也適用於圖像生成。如他們的EvoSDXL-JP的構建,由日語專用圖像生成模型合並英語基本圖像生成模型得到兼容日語的圖像生成模型(對應表中模型6),再將其與更快的生圖模型合並,由此得到支持日語的高速圖像生成模型EvoSDXL-JP(對應表中模型7)。
來源:SakanaAI Blog
SakanaAI極速開發、降本增效的方法論與日本渴望的速度契合。在其發布3個大模型後,又一筆新的融資快速啟動。即使在3月,Sakana AI初期的合並模型效果不佳,日本政府和商界選擇持續投入。
在4月時,SakanaAI是日本工業部「生成式AI加速器挑戰賽」七家獲得贈款的實驗室之一,並贏得了日本政府提供的超級計算機使用權資助,並與NTT和索尼等巨頭公司合作,建設日本人工智能的生態系統。此外,SakanaAI還瞄準了政府機構工作及國防工業的分包合同。
「(日本)公司應該至少該擁有自己的基礎模型,即使這個模型的性能並不是特別好,」David開玩笑說道,「他們需要擁有屬於自己的傳真機。」
據Crunchbase,Sakana AI在6月完成由Lux Capital、NEA、Khosla Ventures聯合領投200億日元(約1.43億美元)融資,投後估值約11.5億美元。也正是因為這筆融資,Sakana AI沒有明確的核心產品,卻成為新興獨角獸。
SakanaAI是日本打造本土大模型的晉級之路上選擇的「明星戰隊」,在其舉國之力發展AI時備受矚目,獲得滿滿的期待和誠意。
02, 主權AI預計「收入」100億美元
不僅僅是日本,世界各國都在對主權AI做出投資。
中美創企和巨頭在大模型上「卷生卷死」。中國研發的大模型數量全球第二,「你領跑,我緊追」的態勢已經不用多說,國家是人工智能發展的有力支撐。
有外媒報導稱,一些國家自認為在移動互聯網和雲計算革命中落後的國家,在此次AI浪潮中要設法保全本土文化與國家安全。
現任新美國安全中心的Pablo Chavez表示:「一些國家政府對生成式AI革命將如何影響經濟感到萬分焦慮」。
這份焦慮正擊中了各國政府的痛點,而唯有行動能戰勝焦慮。
亞洲範圍內,今年4月,韓國、日本政府紛紛出臺政策投資AI領域。韓國的投入金額不少,約為9.4萬億韓元(69.4億美元),支持其成為半導體供應大國的目標。
韓企巨頭們早早就研發了大模型,除了上述Naver的Hyper CLOVA,還有LG的Exaone,KT的Mi:DEUM(韓企開發的首個LLM)等,韓國大型電商、雲服務企業與AI芯片公司合作共同參與政府項目。
新加坡是主權AI的投資大戶,也是英偉達的大買家。
英偉達2023年第三季度業績指出,約15%(27億美元)收入來自新加坡,這與其本身具有多個數據中心和雲服務提供商有關。據Crunchbase數據,東南亞AI、機器學習、數據等相關業務公司約1354家,其中有866家都位於新加坡。
政策方面,新加坡在去年12月出臺政策NAIS2.0,要在未來投資超10億美元用於AI計算、人才和行業發展。而且,新加坡計劃要率先建一個基於東南亞語言訓練的LLM。
眼光轉向電力基礎設施相對落後的印度。
據數據,印度AI大模型領域的公司還不到10家,獨角獸Krutrim的自研模型僅允許400多個字符輸入。印度政府在3月直接批準了國家級「IndiaAI」項目,投入1030億盧比(12.4億美元)旨在實現「讓AI為印度服務」的目標,受主權AI的概念推動,希望建立一個全面的生態系統。
中東土豪選擇砸錢搞先進科技。
阿聯酋成立AI和先進技術委員會(AIATC),今年3月AIATC宣布成立投資公司MGX,由穆巴達拉和G42共同合夥部署前沿技術,投資集中在人工智能基礎設施、半導體和人工智能應用3個領域,據稱資產規模在未來幾年超1000億美元。
沙特公共投資基金(PIF)計劃在AI領域投資400億美元,希望支持一系列初創、芯片企業和龐大的數據中心,甚至是沙特自己創辦人工智能公司。
肯尼亞在5月和G42簽了一份協議,在該國斥資10億美元建一個數據中心,以肯尼亞的地熱能(供電)用斯瓦西裏語和英語訓練一個AI模型。
不缺AI人才的加拿大在4月投入了24億加元(約17.7億美元),20億提算力建基礎設施,剩下的資金賦能初創和研發。一攬子發展AI的計劃推出,確保加拿大人工智能優勢地位。
另一邊,歐洲的人工智能也在暗暗較勁。
線性資本投資者黃松延在訪談中表示,歐洲是很多原創性技術的發源地,AI和機器學習領域的不少大牛藏在歐洲各個角落不為人知。如法國版OpenAI Mistral就在巴黎造出Mistral Large,推理任務不遜色GPT-4。
今年4月,歐盟委員會宣布將在人工智能領域投資6500多萬歐元,其中有5000萬用於擴展大模型能力。法國、德國和意大利都在發力,法國總統馬克龍呼籲歐洲建立政府和社會資本合作買芯片,到2030年或2035年將歐洲全球GPU部署份額從3%提升到20%。
總的來看,各國政府、企業投資本地語言的模型、算力和數據中心,以免發展先進AI技術受製於他國。模型較弱的國家在造地基,而已有強力模型的國家則在構築「護城河」鞏固地位。
這其中,賺錢的人將主權AI的概念變成了產品的USP。
近半年,黃仁勛既參加了阿聯酋的WGS,又在去年9月會見了印度總理莫迪,12月與日本首相和新加坡總理會面,推動政府或政府關聯單位、計算機基礎設施電信公司投資AI。
實際上,主權AI從商人黃仁勛口中說出時,便帶有盈利性質。早在2019年,英偉達就有一項「AI Nations」計劃幫助各國建立主權AI,包括生態系統支持和勞動力發展。各國政府砸錢新建數據中心,用專門的計算機芯片改造舊數據中心,這類芯片大多來自英偉達。
據《華爾街日報》,英偉達在5月表示,主權AI戰略預計將在今年帶來近100億美元的收入,去年還是一片空白。英偉達公布的季度收入是260億美元,其中近一半來自使用其芯片的大型雲計算公司。
CFRA的分析師Angelo Zino得出結論:「(英偉達)面向雲計算的銷售額顯然無法持續攀升,但它能通過其他方式從AI熱潮中獲利。創造更高收入,主權AI正是一個新的收入增長點。」---[作者: 臨風*編輯: 海腰*圖源: SakanaAI官網/來源: 創業邦]