01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

朱嘉明新序:AI與人類智能開始"共智"八大趨勢

2024081917:09

                               

《對話時代:鑄造新質生產力的強國之路》作者:朱嘉明、陶虎、沈陽 等,北京大學出版社 2024年8月出版,定價78元

【導讀】上海書展如火如荼進行著,展館內外人流如織,各個層面的信息、精神對流著、感染著。

由北京大學出版社出版、文匯講堂嘉賓們主講匯集整合而成的新書《對話時代: 鑄造新質生產力的強國之路》在書展亮相並於8月14日上了長安街讀書會8月幹部學習新書書單。該書分為人工智能的"湧現"、虛實世界的融合發展、數智技術的基礎設施三大篇章,主要聚焦人工智能、大模型、芯片、腦機接口、Web3、衛星互聯網、數字生態、元宇宙、AI倫理等主題。

十四場講座,四十一位專家學者、業界精英,包含朱嘉明、林寶軍、王建宇、沈陽、李渺、蔡恒進、盧勇、林龍年,林詠華、陶虎、楊光、危輝、賀樑,季衛東、馮象、江曉原、於海,何靜、付長珍、酈全民等在內的講堂嘉賓,

深度解析新一代信息技術、人工智能、航空航天、生物醫藥、量子科技等領域的科技創新和產業發展,探討全球人工智能發展的前沿、趨勢與挑戰以及人工智能倫理治理等問題,有助於讀者理解新質生產力的概念、內涵及其在推進中國式現代化發展方面的重要作用。

本書體現了科技與人文的對話、技術發展與社會變革的聯動,既有前沿高度又能收獲新知,有助於理解新質生產力的概念、內涵及其在推進中國式現代化發展方面的重要作用。

尤其值得一提的是,本書的序長達1.7萬字,由作者之一、經濟學家朱嘉明親自撰寫,聚焦2022年至2024年人工智能發展的前沿、趨勢與挑戰,其中還詳細闡述了人工智能對宏觀經濟的影響,序裏所含的最新信息截至2024年7月初。今選摘該序的AI發展的前沿、趨勢與挑戰部分。

書展期間,讀者可前往位於東一館E1-07的北大出版社前往購買(六折),也可在當當、京東、淘寶等網絡平臺訂購。

上海書展北京大學出版社現場(東一館E1-07展位)的《對話時代》

* AI 與人類智能開始進入"共智"八大趨勢

人工智能是新質生產力的重要組成部分。人工智能是涉及思想、科技、經濟和社會領域的綜合性技術。

人工智能技術不同於人類歷史上的農業技術、工業技術和信息技術,它發源於自古希臘直至近現代知識精英的一種信仰、一種觀念、一種精神,即智能並非僅僅為人類所有,人類所製造的機器也可能產生智能,因為智能最終是可以被計算的。

1936年,圖靈機的誕生,無疑是人工智能史上裏程碑式的事件。80多年以來,對人類社會而言,人工智能已不僅僅意味著某種科學、技術,而且意味著思想、經濟和社會的顛覆性變革。

經過不斷叠代、演化,人工智能已經並將繼續證明長期主義和加速主義相互作用的歷史意義。本文所討論的是2022年以來全球人工智能發展的前沿、趨勢與挑戰。



1.  大語言模型(或稱大模型)

6月重大突破:可發現和糾正"強化學習"錯誤

人工智能的發展歷史可以分為不同的階段。2022年11月,OpenAI發布ChatGPT,生成式人工智能(Generative Artificial Intelligence, GenAI)開始蓬勃發展。生成式人工智能是基於模仿人類的神經網絡的機器學習技術,通過文本、圖像、音樂、視頻等形式創造全新內容。

GenAI的集中代表就是大語言模型(Large Language Model,LLM)。所謂大語言模型,就是基於大量文本數據訓練的深度學習模型,可以生成自然語言文本或理解語言文本的含義。也可以說,大語言模型是以深度學習為基礎,通過模擬人腦處理信息的方式,使用多層神經網絡來識別數據中的復雜模式。

在現階段,人工智能的核心所在就是大語言模型。世界主要國家和主要公司主導了大語言模型的開發,呈現井噴式增長,形成不斷膨脹的大語言模型集群。影響大語言模型性能的主要變量是訓練數據、模型規模(即參數數量)、生成算法和優化技術。

大語言模型的特點包括:(1)參數大。大語言模型的參數數量通常可以達到數十億甚至數千億。(2)具有圖像識別和預測分析能力。(3)具有數據的理解和泛化能力。能夠學習並執行多種復雜的任務,在自然語言處理(NLP)中,實現機器翻譯、情感分析和智能問答的精準和高效。

ChatGPT與谷歌的Gopher、LaMDA,以及Meta的Llama是大語言模型的全球代表。其中,2023年,OpenAI發布的GPT-4是一個系列的模型總稱,而不是一個單獨的模型。

2024年5月,OpenAI推出的GPT-4o模型在文本、語音和圖像的理解方面,展現出處理數百種語言的卓越能力,且能進行實時語音對話,準確捕捉和表達人類情感。

同年6月,Anthropic公司正式推出的Claude 3.5 Sonnet模型,在編碼能力、視覺能力和互動新方式方面超越了Claude 3 Opus和GPT-4o。

更令人興奮的是,Claude 3.5 Sonnet引入創新的"Artifacts"功能,允許用戶在動態工作空間實時編輯和構建AI生成的內容,將對話式AI轉變為一個協作夥伴,無縫集成到用戶的項目和工作流程中。特別是Claude 3.5 Sonnet還以其兩倍於前代的速度和1/5的成本,重新定義了智能模型的性價比。

同樣在這個6月,大語言模型領域出現突破性進展:OpenAI發布基於GPT-4模型的CriticGPT,用於捕捉ChatGPT代碼輸出中的錯誤。

也就是說,CriticGPT就是一個通過GPT-4查找GPT-4錯誤的模型,不僅可以撰寫使用者對ChatGPT響應結果的評論,而且可以幫助人類訓練者更好地理解和滿足人類的意圖,發現和糾正基於人類反饋的強化學習(Reinforcement Learning with Human Feedback,RLHF)的錯誤,表明人工智能在評估高級AI系統輸出的目標方面邁出關鍵一步。

2.  AI 平臺

全球有九大平臺,趨勢是垂直化和專業化

伴隨AI覆蓋人類生產和生活的方方面面,構建AI平臺成為大勢所趨。AI平臺提供的是全球領先的語音、圖像、NLP等多項人工智能的多模態技術,以及開放對話式人工智能系統和生態。目前,全球有谷歌、TensorFlow、微軟Azure、OpenAI、英偉達、H2O.ai、亞馬遜網絡服務(Amazon Web Services,AWS)、DataRobot和Fotor所提供的九大AI平臺。

其中,英偉達 Omniverse是專為虛擬協作和實時逼真模擬打造的開放式平臺,借助GPU和CUDAX AI軟件等強大的生態系統,提供業界領先的解決方案,包括機器學習、深度學習和數據分析。

AI平臺的發展趨勢主要是垂直化和專業化。例如,AI美術平臺是通過人工智能技術進行圖像處理和創作的平臺,幫助藝術家和非專業人員以人工智能繪畫形式快速生成有趣、具有美學價值的繪畫作品,從中形成創作靈感和藝術體驗,給藝術界帶來更多的創新和可能性。

Midjourney、Stable Diffusion屬於影響力不斷擴展的AI美術平臺。又如,Suno v3.5作為AI音樂生成工具,生成的音樂長度由原來的2分鐘變成了4分鐘,音樂結構顯著優化。AI音樂生成平臺對於很難用語言描述清楚的聽覺藝術的內行程度,展現出具有超越人類的創作潛力。

Suno宣布還將推出一項全新的功能,允許用戶用任何聲音創作歌曲。這項新功能可以將日常生活中的各種聲音轉化為音樂,為音樂創作帶來了新的可能性。

3.  AI 堆棧

基礎支柱包括:數據、計算和模型

從硬件的角度看,AI堆棧(AI stack)的基礎是GPU、CPU和TPU。生成式AI堆棧中最重要的是GPU。但是,AI堆棧還包括AI軟件體系,最終構建的AI堆棧是一個系統和生態。

深入分析可知,AI堆棧是一個結構化框架,包含了開發和部署AI系統所需的各種層次和組件。AI堆棧的關鍵組件包括數據管理、計算資源、機器學習框架和機器學習運維(MLOps)平臺。

生成式AI的堆棧包含三個層級:頂層、中層和底層。頂層涉及特定領域的知識和專業知識,中層提供可用於構建AI模型的數據和基礎設施,底層則是雲計算資源和服務。

在每個層級中取得進展對於推動AI的發展至關重要。AI堆棧的基礎支柱包括:數據、計算和模型。其中,生成式AI需要大量的計算資源和大型數據集,這些資源在高性能數據中心進行處理和存儲生成式AI推動了全棧的重塑。

一般來說,基於AI堆棧,可以構建具有快捷搜索、快捷翻譯、智能識別、智能操控等特征的人工智能應用程序。

4.  物理世界模擬器

第三個是AI物理世界:超越人類時空感知

對於當代人類而言,存在三個世界:現實的經驗世界、虛擬世界與超越人類時空感知的物理世界。人工智能直接影響了人類與以上三個世界的關系。

在現實的經驗世界,人工智能和自然智能的平行和互動,改變了現實世界存在的方式;在虛擬世界,人工智能和現實虛擬技術可以引導人類進入非真實的沈浸式體驗狀態,元宇宙就是其中的一種方式;在超越人類時空感知的物理世界,人工智能可以幫助人類突破感官的局限性,認知以百億光年為尺度的宇宙和以納米為衡量單位的微觀場景。

在科學實驗領域,人工智能技術不再僅僅是工具,而且是前提。

2024年年初,Sora出現的根本意義是:通過自身的物理世界模擬器(world simulator)功能,展現了一個人類可能沒有感知的物理世界,一個很可能比人類眼睛看到的更真實的物理世界。人類一旦感知和融入因為AI物理引擎所創造的世界,將會體驗更加多樣的物理規則。

Sora 在進行視頻生成任務時,基於感知、記憶、控製模塊的支持,生成的視頻一定程度上能夠遵循現實世界的物理規律,這使得其模擬現實世界中的人物、動物、環境等,擁有了更廣闊的想象空間,基本實現了空間一致性、時間一致性和因果一致性。

Sora是一個可讀懂世界模型,其現階段做得如何,並非問題的本質。Open-Sora 1.1發布後,視頻生成質量和時長大幅提升。優化後的Causal Video VAE架構極大地提升了Sora的性能和推理效

英偉達的重要貢獻之一是完成了Earth-2 數字孿生地球模型。Earth-2結合了生成式AI模型CorrDiff,基於WRF數值模擬進行訓練,能以12倍解析度(從25公里範圍提高到2公里)精確預測天氣信息。Earth-2的下一步是將預測精度從2公裏提升到數十米。解析度更高,相比物理模擬的運行速度提高了1000倍,能源效率提高了3000倍,也就是說可以實時預測。

前景是非常清楚的:人類將構造作為感知/記憶/控製綜合體、具有構建逼真和物理正確的"世界模型"。正是在這樣的意義上,微軟科學家塞巴斯蒂安·布貝克(Sébastien Bubeck)提出了"AI物理學"概念和研究方向。英偉達CEO黃仁勛也提出:AI的下一波浪潮將是物理AI。

所以,英偉達的數字孿生目標不只是地球,還有整個物理世界。



5.  具身智能和智能機器人

最終極應用:讓人工智能具象成為"人"

人工智能的發展,必然導致人工智能生態的形成。而具身智能(Embodied Artificial Intelligence, EAI)或者智能機器人就成為人工智能生態中的主體。

具身智能是人工智能在物理世界的進一步延伸,是能夠理解、推理並與物理世界互動的智能系統,具有人機交互與自然語言理解的能力,實現思考、感知、行動。

進一步說,智能機器人會模擬人的思維路徑去學習,作出人類期待的行為反饋,在多模態AI的驅動下,自我學習、感知世界、理解並執行人類指令,完成個性化任務和協作要求,持續進化。

即在真實的物理環境下,執行可以被檢驗和測量的各種各樣的任務。簡言之,具身智能的特質就是能夠以主人公的視角去自主感知物理世界。

至於各種不同形態的智能機器人,是具身智能的物理存在方式,其整體架構由感知層、交互層、運動層組成。

特斯拉旗下人形機器人"擎天柱"從一代發展到二代、美國人形機器人初創公司Figure AI今年2月獲得巨額投資,以及英偉達2024年全球技術大會(GTC)上展出25款人形機器人,都顯示了人形機器人領域的快速發展。

2024年3月,英偉達推出了世界首款人形機器人通用基礎模型——Project GR00T。該模型驅動的機器人能夠理解自然語言,並通過觀察人類行為來模仿動作,用戶可以在此基礎上教會其快速學習協調各種技能,以適應現實世界並與之互動。

Project GR00T的出現預示著真正的機器人時代可能要來了。這也是AI的最終極應用:讓人工智能具象成為"人"。

具身智能的興起,標誌著機器人技術從傳統的以控製為主,轉向了學習、操作的新範式。大模型技術的爆發和硬件成本的降低,使得旨在開發出能與物理世界交互的智能機器人的具身智能企業如雨後春筍般湧現。

2024年5月,作為機器人領域最具影響力的國際學術會議之一的國際機器人與自動化會議(IEEE ICRA)在日本橫濱舉行。

今年的會議主題"CONNECT+",不僅展示了機器人技術的最新進展,而且是一場"具身智能"和"學習"的革命。從長遠看,具身智能對人工智能產業發展意義重大,對通用人工智能(Artificial General Intelligence,AGI)具有不可忽視的價值。



6.  空間智能

絕不僅僅是機器版的人眼,以從未想象的角度揭示世界

現在存在兩種空間智能(Spatial Intelligence):一種是自然進化形成的空間智能。大自然花費了數百萬年時間,讓人類進化出空間智能,眼睛捕捉光線,將2D圖像投射到視網膜上,再由大腦將這些數據轉換成3D信息。

另一種是以人工智能技術為基礎的空間智能,即機器模擬人類的復雜視覺推理和行動,在多種傳感器輔助的情況下,通過視覺信息直接理解和操作3D世界。

比較自然進化形成的空間智能和以人工智能技術為基礎的空間智能,差異是顯著的:自然進化形成的空間智能在空間維度上是有限的,突破3D空間是困難的,甚至是不可能的。

但是,以人工智能技術為基礎的空間智能可以突破空間維度。這樣的空間打破了地理界限,處於流動的、無邊無際和自由開放狀態。

不僅如此,這樣的空間不再受製於牛頓的時間限製,實現了及時性和時間優化。例如,谷歌研究人員開發出一種算法,只需要一組照片,就能將數據轉化為3D形狀或場景。

在這方面,斯坦福大學以人為本AI研究院院長(美國工程院院士)李飛飛有過以下深刻的思考:"把視覺敏銳度和百科全書式的知識深度結合,可以帶來一種全新的能力。

這種新能力是什麽尚不可知,但我相信,它絕不僅僅是機器版的人眼。它是一種全新的存在,是一種更深入、更精細的透視,能夠從我們從未想象的角度揭示這個世界。

"也就是說,建立在人工智能技術基礎之上的空間智能將突破自然進化形成的空間智能,展現一個人類無法依賴大腦想象的空間狀態。例如,量子力學所描述的量子空間指的是由一些離散的或者連續的態組成的、具有拓撲特征的空間。人類自然進化而來的空間智能沒有可能感受和認知量子空間,人工智能技術支持的空間智能則是可能的。

總之,基於人工智能大模型的空間智能引導人類進入"一種全新的存在",而具身智能很可能是這裏的"原住民"。



7.  人工智能深層演變

摩爾定律或被突破,元認知導致標度律失效

人工智能正處在深層演變的歷史時刻。摩爾定律(Moore』s Law)、標度律(Scaling Law)逐漸發揮著越來越重大的作用。

摩爾定律是英特爾創始人之一戈登·摩爾(Gordon Moore)基於經驗所總結的一個規律,即集成電路上可以容納的晶體管數目在大約每經過18個月到24個月便會增加一倍。

換言之,處理器的性能大約每兩年翻一倍。問題是當芯片進入28納米(nm)時,發生了摩爾定律危機。當芯片進入1納米製程芯片時,意味著到達摩爾定律極限。現在人工智能以芯片為核心的整個硬件基礎正面臨摩爾定律危機或者摩爾定律極限。

2024年6月,在2024臺北國際電腦展(Computex 2024)上,英偉達CEO黃仁勛宣布,其GPU架構的更新頻率將從兩年一次更新加速到一年一次,但算力增長並未停滯,其AI芯片的算力在過去的8年間實現了驚人的1000倍增長,這說明存在突破摩爾定律危機和摩爾定律極限的技術可能性。

標度律主要涉及臨界現象的研究,其核心思想是:隨著模型參數量大小、數據集大小和用於訓練的浮點數計算量的增加,模型的性能會提高。為了獲得最佳性能,上述三個因素必須同時放大。當不受其他兩個因素的製約時,模型性能與每個單獨的因素都有冪律關系。

具體到人工智能領域,GPT-4在具體問題上的性能預測,可以通過比GPT-4小1000倍的模型預測得來。也就是說,GPT-4還沒開始訓練,它在這個問題上的性能就已經知道了。所以,標度律對於大模型的訓練而言很重要。可以說,標度律是人工智能深層演變的又一個潛在規律。

不久之前,比爾·蓋茨 (Bill Gates) 在一期The Next Big Idea播客中就標度律發表了比較深刻的看法:"標度律肯定還會接著有效。但與此同時,從今天我們所擁有的簡單算法到更像人類的元認知的各種行動將會改變,這是一個更大的前沿。"因為意識可能與元認知相關,而元認知並不是一個可以測量的現象。或者說,元認知導致標度律失效。



8.  近中期趨勢

通用AI階段正加速到來,超級AI"曙光"已現

站在2024年的時點上,可以大體看清楚人工智能的近中期趨勢:

(1)狹義人工智能(Artificial Narrow Intelligence,ANI)階段即將結束。在這個階段,人工智能是能執行特定任務的AI系統,如圖像識別或語音識別。這個階段的高峰是支持生成式人工智能的大模型的出現,以及智能機器走向普及。

(2)通用人工智能階段正在加速到來。

(3)超級人工智能(Artificial Super Intelligence,ASI)的"曙光"已經出現在地平線上。超級人工智能具有超越"人類心智",趕上並迅速超越全人類的集體智慧,比人類智能還要強大的人工智能系統。

人工智能已經處於每天刷新人們想象力的歷史時期。在這個時期,迄今為止的世界主體和參照系會發生改變,知識體系會被重構,人類智能和人工智能開始進入"共智"(Co-Intelligence)狀態,傳統經濟組織、國家體製和法律體系也會發生變化,未來人類文明甚至會被重組。

---*朱嘉明-(原序中標題和小標題由編輯有所補充和微調)*

---[文:朱嘉明*圖:朱梅全*編輯:李念*責任編輯:李念/來源: 文匯報 |2024上海書展① ]