01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

專訪元宇宙教母凱西·哈克爾:空間計算是立馬可用的變革性工具

2024080422:25

近年來,隨著空間計算概念的誕生,出現了一些空間計算產品,如 Apple Vision Pro。而很多人也把 2024 年,看作是空間計算元年。

前不久,全球設計和創新工作室 Journey 聯合創始人,有「元宇宙教母」之稱的凱西·哈克爾(Cathy Hackl),與沈浸式空間領域專家、DADOS 科技公司高級產品副總裁伊雷娜·克羅寧(Irena Cronin)基於對空間計算技術將如何徹底改變各個行業的深刻認識,聯合創作了《空間計算:人工智能驅動的新商業革命》,該書由中信出版集團出版。



圖 | 從左到右:本書第二作者伊雷娜·克羅寧(Irena Cronin)、本書第一作者凱西·哈克爾(Cathy Hackl)(來源:資料圖)

日前,圍繞空間計算這一話題,DeepTech 與上述兩位作者展開了交流。

圖 | 《空間計算:人工智能驅動的新商業革命》(來源:資料圖)

01,  代表繼手機之後的下一代人機交互平臺,有望在未來十年改變人類生活和生產

空間計算是指以情境感知和與物理世界集成的方式,與對象和環境進行數字表示和交互。

與將用戶沈浸在完全虛擬環境中的虛擬現實(VR,Virtual Reality),或包含增強現實(AR,Augmented Reality)和 VR 的擴展現實(XR,Extended Reality)不同,空間計算能將數字信息與我們的物理環境無縫融合。

因此,這需要使用 AR、AI 和地理空間分析等技術,來創建一個連貫的、上下文感知的層,以增強現實世界的體驗。

從該書的封面可以看到,空間計算被認為是「繼手機之後的下一代人機交互平臺」。

原因在於,它改變了我們與數字信息交互的方式。不再局限於屏幕,而是將數據帶入物理環境,讓交互變得更加直觀和自然。

這一轉變,使人們能夠更身臨其境、更高效、更有意義地參與技術,為醫療保健、教育、零售等領域的創新開辟了新的可能性。

以教育、工作和購物為例,我們可以看出,空間計算有望以重大方式改變日常活動。

具體來說:

在教育領域,空間計算將創造沈浸式和互動式的學習體驗。學生可以進行虛擬科學實驗,並與 3D 模型互動,使學習更具吸引力和有效性。教師通過使用空間計算工具,能夠創建定製和自適應的學習體驗,以滿足個別學生的需求。

在工作場所,空間計算將增強遠程協作和生產力。虛擬工作空間將允許團隊在 3D 環境中協作,使遠程會議更具互動性和吸引力。此外,空間計算還將通過創建逼真的模擬和交互式教程,來促進更好的培訓和入職流程。

在購物領域,空間計算通過將 AR 和混合現實(MR,Mixed Reality)技術集成到在線和店內環境中,或徹底改變零售體驗。

消費者能以更身臨其境的方式與產品互動,如虛擬試穿衣服;零售商則可以創建虛擬商店,便於客戶如同親自在場一樣去瀏覽和購買商品,從而提高了便利性和個性化。

需要了解的是,在空間計算的發展和實施中,AI 發揮著關鍵作用。

其一,允許在空間計算中實現高度個性化的體驗。

其二,推動空間計算中自主系統的發展。

其三,使大量數據的實時處理和分析成為可能。

其四,AI 算法會增強空間映射和環境理解,使設備能夠更好地解釋物理世界並與之交互。

其五,提供預測分析,並支持各個行業的決策過程。

其六,改善空間計算環境中的安全和監控。

其七,簡化空間計算平臺中內容的創建和管理。

總之,AI 是空間計算發展不可或缺的一部分,兩者之間的融合將帶來更具突破性的發展,從而塑造人機交互的未來。

在該書的兩位作者看來,未來十年空間計算的進步和趨勢,有望徹底改變我們日常生活、行業和技術互動的諸多方面。

也就是說,與空間計算相關的技術,不僅會變得更容易獲得、更實惠,推動人類體驗和能力的深刻變革,還將增強我們與世界的互動方式,提高各個部門的效率,並為創新和增長創造新機會。

02,  多行業協同對於部署空間計算十分關鍵,但也必須解決相關風險和挑戰

在知曉空間計算對人類社會的重要性之後,企業也應當註意,不同行業(如技術、零售和醫療保健)之間的合作,對於推進空間計算來說非常關鍵。

比如,在科技領域,公司可以開發為空間計算提供動力的基礎硬件和軟件,這包括推動 AI、AR、MR 等技術的進步。

就拿醫療保健領域來說,與科技公司的合作能夠為醫療專業人員開發先進的診斷工具、AR 引導的手術和基於 MR 的培訓模擬。而零售公司可以通過設計用戶友好的界面和應用程序,使醫療服務提供者和患者能夠訪問這些技術。

然而,由於在企業中實施空間計算也會面臨諸多風險和挑戰,因此必須解決相關問題以確保該技術被成功采用和集成。

一個主要的挑戰是,開發和部署空間計算技術的高昂成本。企業不僅需要在硬件、軟件和基礎設施方面進行大量投資,還必須投入與維護、更新和培訓員工有效使用這些技術的相關持續成本。

另一個挑戰是,將空間計算集成到現有業務系統中所涉及的技術復雜性。這不但需要專業技能和專業知識,還需要大量的時間和資源,才能夠開發出針對特定業務需求定製的應用程序,並保證不同系統之間的無縫交互和數據交換。

用戶的采用和培訓也是要解決的關鍵挑戰。比如,員工也許會因為不熟悉或認為復雜而抵製使用新技術。同時,如果長時間使用 AR 和 MR 設備,可能會讓用戶受到潛在的身體和心理影響。

數據隱私和安全問題,則是與空間計算相關的重大風險。收集和處理大量個人和敏感數據,如位置信息和生物特征數據,會涉及到隱私問題。所以,企業在實施強有力的數據保護措施的同時,也必須遵守相關法規和標準,以防止未經授權的訪問和違規行為。

最後,還要考慮倫理因素和社會影響。這是因為,空間計算的使用可能會引發與監視、許可和數字鴻溝相關的倫理問題。

那麽,該如何解決與空間計算相關的倫理考慮和潛在的隱私問題呢?

首先,透明度和許可至關重要。這意味著要確保用戶充分了解正在收集的數據、將如何使用這些數據,並在任何數據收集開始之前獲得他們的明確許可。

其次,讓數據最小化。這涉及只收集應用程序功能絕對必要的數據,以降低隱私泄露的風險。

接著,應采用匿名化用戶數據的技術,使其無法追溯到個人,保護他們的身份和隱私。

再次,進行安全的數據處理。在傳輸和存儲過程中,應使用強大的加密方法來保護數據,確保敏感信息免受未經授權的訪問。

同時,遵守倫理設計原則。系統的設計應積極尋求識別和減輕偏見,確保公平公正地對待所有用戶。

另外,空間計算應用程序還必須遵守通用數據保護條例等相關數據保護法律法規。

最後,開發決策過程透明的 AI 系統,並遵循 AI 開發中的道德準則,促進 AI 在空間計算中的責任和道德使用。

03,  不僅是未來的概念,也是現在可用的變革性工具

據了解,正是對技術如何改變人們對周圍世界的感知和互動的好奇,促使本書的兩位作者開啟了探索空間計算的旅程。

她們觀察到公司如何使用空間計算來創造沈浸式體驗、優化物流和增強決策過程。在此基礎上,開始進一步調查,檢查案例研究並采訪該領域的先驅,以了解這些技術的實際應用和未來影響。

就《空間計算:人工智能驅動的新商業革命》這本書而言,它提供了關於如何將空間計算集成到各種商業模式中的見解,采用空間計算帶來的挑戰以及它帶來的巨大機遇,致力於幫助企業在日益數字化和空間感知的世界中更好地發展。

通過理解空間計算並將其整合到商業模式中,領導者可以保持領先地位,創造更身臨其境、更具吸引力的體驗、優化運營,並做出更明智的決策。

因此,該書不僅是一本技術指南,也是商業領袖、企業家和技術專家的戰略路線圖。

而通過閱讀這本書,讀者也將學到 AI、AR、VR 和地理空間分析等空間計算,不僅是未來的概念,而且是現在可用的變革性工具。---[運營/排版:何晨龍/來源: DeepTech深科技]

*鏈式思考如何激發大模型算術推理能力?科學家從神經元激活角度給出答案*

大模型在過去一兩年中受到了廣泛關註,尤其是它在解算數數學題上取得的成績。

實際上,早在 2022 年,Google Research 團隊的研究人員,就提出了思維鏈(CoT,Chain-of-Thought)提示這種能夠有效提高大模型數學推理的提示工程方法,並在少樣本上下文學習中驗證了它的有效性[1]。

雖然該方法很快便得到了廣泛應用,但是關於其究竟如何激發大模型的算數推理能力,該領域的研究人員仍然知之甚少。

此前,已有的相關探索主要集中在,試驗性地觀察 CoT 提示語句中的不同組成部分,對大模型算數推理效果的影響。

具體來說,嘗試替換或移除 CoT 提示語句中的組成部分,例如移除 CoT 樣本中的文字推理部分,僅留下關鍵性數學公式,並通過觀察替換或移除前後大模型在已有算數推理基準測試上的表現差異,來判斷該替換或移除部分是否對激發大模型的算數推理能力有重要貢獻。

雖然從這些研究中,該領域的研究人員已經發現了若幹有趣的現象,但仍然無法從神經網絡內部機製上解釋,CoT 如何激發大模型的算數推理能力。

與此同時,這些研究也帶來了更多問題。例如,為什麽 CoT 的不同組成部分,會給大模型的算數推理帶來不同程度的影響。

為解決上述問題,美國喬治梅森大學姚子瑜教授和團隊,從「模型可解釋性」的角度出發,在開源的 Llama2 模型上展開了一系列探索,並提出用「神經元激活」來系統性地解釋已有研究在 CoT 上觀察到的現象。



圖丨課題組成員(來源:課題組)

近日,相關論文以《探究神經元激活作為一種統一視角,以解釋大型語言模型中的鏈式思考引發算術推理》(An Investigation of Neuron Activation as a Unified Lens to Explain Chain-of-Thought Eliciting Arithmetic Reasoning of LLMs)為題被國際計算語言學年會(ACL,Annual Meeting of the Association for Computational Linguistics)2024 接收[2]。

喬治梅森大學博士研究生大金·萊(Daking Rai)是第一作者,姚子瑜擔任通訊作者。



圖丨相關論文(來源:ACL 2024)

研究中,他們首先集中探索了 Transformer 前饋層,是否表達了算數推理概念的神經元。

相關概念包括加減乘除的算數操作概念、算數推理過程中的邏輯鏈接概念(如「…所以」「…接下來」),以及其他算數計算概念(如「百分比」「算法」「公式」)。

因此,為發掘每個神經元所代表的概念,他們把神經元映射到了大模型的詞匯空間,並通過標註神經元映射後在每個詞匯上的概念比重,來總結該神經元代表的意義。

該課題組提出用 GPT-4 來閱讀理解神經元的詞匯映射,以自動化這一神經元標註和挖掘過程。

實驗表明,Transformer 前饋層確實存在代表了算數概念的神經元。當這些神經元遭到破壞,大模型的算數推理能力就會受到損害。

同時,研究人員還觀察到這些神經元的活躍程度,與大模型的算數推理能力成正相關。這樣的正相關解釋了,為什麽不同提示語句會給大模型的算數推理帶來不同的效果。

基於這些神經元,該團隊系統地解釋了已有研究觀察到的四個 CoT 相關現象。

第一,當數學公式從 CoT 樣本裏移除而只留下運算結果時,大模型的算數推理能力會受損。

第二,當文字推理從 CoT 樣本裏移除而只留下數學公式時,模型能力也受損。

第三,當 CoT 樣本失去運算多樣性,比如所有的樣本都只涉及加法運算時,模型能力受損。

第四,當 CoT 樣本的運算結果錯誤而推理過程正確時,模型能力不受到顯著影響。

「我們看到這些現象基本上都可以用神經元的激活程度來解釋。比如在數學公式移除前後,激活狀態的神經元數量下降,解釋了為什麽模型的算數推理能力受損。」研究人員解釋道。

從應用上看,該成果將會在兩個方面擁有應用前景。

其一,用來預測大模型的能力。

在實驗中,研究人員已經可以看到,代表算數推理的神經元的激活程度,與 Llama2 模型的算數推理能力成正相關。這就意味著未來也許並不需要基準測試,就可以直接預測大模型在特定任務方面的能力。

同時,因為基準測試需要很多人力物力,如數據集標註和計算資源,所以通過理解大模型的內在機製來直接預測它的能力,也有助於節省成本。

另外,該領域的從業者都希望在不久的未來,大模型能夠完成超人類的任務。但局限於人的能力,這些任務沒有辦法構建基準測試。而通過大模型的內在機製來預測模型能力,可以很好地規避這一問題。

其二,通過控製大模型的內在機製,來增強或削弱模型的能力。

「我們認為這一應用會在未來成為提高大模型安全性的重要方法之一,同時它也有潛力實現更高效的大模型訓練,例如通過小數據定位神經元,然後通過控製神經元的激活來達到模型訓練的目的。」課題組表示。

實際上,2023 年下半年,OpenAI 就提出了「超級對齊」的提議[3],旨在通過鼓勵科研創新,來幫助人類監管和控製超人類 AI 模型。預測和控製模型能力,正是實現這一目的的兩個重要任務。

「這項成果是我們在這個方向上的一個初步探索,希望後續我們或者其他研究員可以繼續在這個方向探索。」該團隊說。而該研究受到「機製解釋性」的啟發。

這是一個近幾年迅速興起並得到廣泛關註的模型可解釋性子領域。不同於以往的可解釋方法,機製解釋性試圖通過對神經網絡進行逆向工程,來理解該模型的行為機製。

目前,這類方法已經在大模型行為和結構功能的解釋上得到了應用。

「而其中一個對我們有極大啟發的研究是,來自美國艾倫人工智能研究所和以色列巴伊蘭大學的研究員,在 Transformer 前饋層上的探索[4]。」研究人員說。

該研究發現,在大模型預測下一個詞匯單元的過程中,模型的 Transformer 前饋層會通過在詞匯空間中不斷強化相關概念來構建預測。這個概念強化是通過激活 Transformer 前饋層的神經元來實現的。

「這個機製層面的發現啟發了我們的猜想:CoT 之所以能夠激發大模型在算數推理上的能力,也許是因為它能夠有效激活 Transformer 前饋層中代表算數推理概念的神經元,而這些神經元幫助了大模型算數推理能力的強化。」課題組表示。

基於此,該課題組設想是否存在一種機製,能夠直接增強大模型,尤其是小量級大模型的算數推理能力。

該團隊指出:「這是一件非常有意義的事情,因為小量級大模型享有獨特的運算效率、經濟效率和安全性。」

並且,在同一時期,他們也看到一些研究通過收集高質量數據或修改訓練目標函數,來提高小量級大模型在特定領域或任務上的能力。但是,機製解釋性在這上面的應用還處在新興階段。

盡管如此,該團隊的科研過程也並非一帆風順,甚至在剛開始就面臨「卡殼」。

其中,最大的難點在於,他們並沒有充分了解大模型做算數推理的內在機製,也自然無法實現所暢想的模型控製。

「因此,我和學生萊,也就是該論文的第一作者,決定先把精力集中在解釋大模型的算數推理上。」姚子瑜說。

但他們很快又遇到下一個難點。

「算數推理」是一個高度抽象的概念,而大模型的預測執行在具體的詞匯單元層面。

如果要從「神經元在詞匯空間的概念強化」這一角度,來理解大模型的算數推理能力,首先就要把這一高度抽象的概念,落實到具體的詞匯層面的概念上。

為彌補這個差距,該課題組首先總結了若幹算數推理相關的更低層級的概念,這包括算數運算符、算數推理中的邏輯語言表達,以及其他算數計算概念。

並通過運用 GPT-4 高效地標註和搜索表達了這些低層級概念的神經元。然後,他們又參考了前人研究,對這些搜索到的神經元進行驗證。

「實驗結果證明,這些神經元確實對我們實驗的大模型 Llama2 有著重要作用。」課題組說。

這也讓他們更有信心在這個方向繼續探索。

他們想到用這些神經元的激活狀態來統一地解釋 CoT 對大模型算數推理能力的效果,包括解釋若幹之前工作觀察到的現象。

而結果也基本上驗證了他們的猜想,即 CoT 不同組成部分對大模型算數推理能力的激發作用,是可以用相關神經元的激活來解釋的。

不過,該研究也指出,神經元激活並不能解釋大模型所有的算數推理表現。同時,研究人員在 Llama2 上的發現是否適用於其他大模型族群,也有待進一步驗證。

另據悉,姚子瑜實驗室目前有若幹 2025 年秋季入學的全獎博士名額。詳情歡迎查看該團隊網站 https://ziyuyao.org/ 和郵件咨詢。---[排版:初嘉實/來源: DeepTech深科技]

參考資料:
1. Wei, Jason, Xuezhi Wang, Dale Schuurmans, Maarten Bosma, Fei Xia, Ed Chi, Quoc V. Le, and Denny Zhou. Chain-of-thought prompting elicits reasoning in large language models.Advances in neural information processing systems 35 (2022): 24824-24837.https://doi.org/10.48550/arXiv.2201.11903

2. Daking,Rai,Ziyu,Yao,An Investigation of Neuron Activation as a Unified Lens to Explain Chain-of-Thought Eliciting Arithmetic Reasoning of LLMs.arXiv:2406.12288.https://doi.org/10.48550/arXiv.2406.12288

3. OpenAI. Introducing Superalignment. https://openai.com/index/introducing-superalignment/. 2023.

4. Geva, Mor, Avi Caciularu, Kevin Wang, and Yoav Goldberg.Transformer Feed-Forward Layers Build Predictions by Promoting Concepts in the Vocabulary Space.InProceedings of the 2022 Conference on Empirical Methods in Natural Language Processing, pp. 30-45. 2022.https://arxiv.org/abs/2203.14680