打通AI「任督二脈」，國產自研通用大模型「砭石」實力邁向AGI

2024043015:13

【新智元導讀】全球領先AI公司智慧眼發布了自研的通用大模型——砭石，海量代碼文本數據訓練後展現出強大的湧現能力，不僅能實現代碼生成，韻律創作，甚至是多模態AI理解效果驚人。

每一次關鍵技術取得通用化的突破，都會深刻改變生產方式，並顯著提升生產力水平，而「大模型」成為了打通人工智能技術通用性「任督二脈」的關鍵。智慧眼，作為全球領先的人工智能企業，最近推出了其創新研發的通用大模型——砭石。

AI正在從感知智能、認知智能向決策智能快速叠代演進。

在1.0時代，感知智能中以計算機視覺為代表，即基於深度學習算法，賦能計算機理解數字圖像和視頻，智慧眼正是在這個時候構建了機器視覺大模型，並在IDC的中國人工智能之計算機視覺應用市場份額排名中進入前七，榮獲中國智能科學技術最高獎——吳文俊人工智能科技進步獎。

2.0階段，認知智能將從認知心理學、腦科學及人類社會歷史中汲取靈感，並結合跨領域知識圖譜、自然語言處理、因果推理等技術，建立穩定獲取和表達知識的有效機製，智慧眼發布了人工智能中臺和大數據中臺產品，實現了從感知智能到認知智能的跨越。

到了3.0時代，AI+X成為前沿方向，需要采用海量的高質量通用數據訓練一個基礎的底座，再針對不同的場景，利用少量的專業數據進行微調，實現低成本的AI場景落地。

智慧眼研發了通用大模型砭石，該模型基於嚴格審核過濾的海量多模態數據訓練，通過「預訓練+精調」模式帶來了新的標準化AI研發範式，實現AI模型在更統一、簡單的方式下規模化生產，支持多種任務執行。

大模型生成代碼，砭石通過對開源代碼數據集進行多次清洗，得到高質量的代碼數據集，隨後通過預訓練和CoT訓練等方式，使得大模型具有強大的代碼生成和推理能力，極大地提高了軟件開發的效率和質量。

大模型寫作能力，砭石大模型在更多參數和更復雜的結構基礎上，使用海量的通用文本型數據進行預訓練，學習了大量通用知識和邏輯，表現出了強大湧現能力和學習能力，生成了富有韻律、節奏和情感表達的詩歌。

砭石大模型基於自然對話方式理解和執行任務，提供多種能力包含文本、圖像、視頻、音頻輸入，生成式輸出文本信息，具備閑聊和知識問答能力，可以為情感陪伴、政策問答、大數據分析等場景賦能。

三大核心技術賦能，新一代大模型順勢而出

大模型的創新，遠不止於模型本身的革新，其更深層次地依賴於人工智能領域中的各項核心技術突破。

在這方面，智慧眼公司擁有顯著的優勢，其在知識圖譜、智能大模型以及隱私計算等關鍵技術上，都擁有自主研發的核心算法和獨立的知識產權，這為通用大模型創新提供了堅實的基礎。包括：

    在知識圖譜方面：公司突破保護隱私的分布式知識遷移和聯邦圖譜推理，接入差異化的大規模行業數據，構建世界一流的高可信高質量的海量數據知識圖譜，為知識圖譜緩解大模型幻覺奠定基礎。

    在智能大模型方面：公司突破了隱私計算條件下的大模型聯邦訓練、基於知識圖譜的大模型知識增強等核心技術，顯著提升大模型在專業領域的信息生成準確度。

    在隱私計算方面：突破了保護隱私的分布式知識遷移和聯邦圖譜推理技術，實現對高價值用戶的敏感隱私數據的脫敏，真正做到數據的「可用不可見」安全應用，實現分布式知識的融合和基於分布式數據的大模型訓練，支撐了用戶數據價值的釋放。

四大基礎模型融合，共同塑造超強通用能力

智慧眼砭石大模型的核心定位是為各行各業註入新的活力，采用完全的分層解耦設計，包括兩層：

    第一層為砭石通用大模型層，主要包括機器視覺、自然語言理解、多模態和認知4大基礎模型，為各種應用場景提供相關的AI基礎能力；

    第二層為行業大模型，基於通用大模型層，能夠整合行業用戶的自有數據，訓練客戶的自有專有大模型。

通過這種分層次的設計，智慧眼砭石大模型不僅提供了廣泛的通用能力，還能根據各行業的具體情況，實現高度個性化的賦能。

具體來說，基礎模型層面包含：

    機器視覺大模型，「為機器植入眼睛與大腦」。此模型通過在大規模圖像數據上進行訓練，可以實現各種視覺任務，能夠進行圖像的分割和識別、分析視頻等。

    自然語言理解大模型，「讓機器理解人類語言」。此模型基於數T Token的高質量語料訓練而成，能夠實現負責的自然語言處理任務。

    多模態大模型，「讓機器擁有豐富感官」。此模型通過對文本、圖片、視頻和音頻等不同儲存信息載體的認知和理解，來模擬人與人之間的交互方式，為創新性應用提供了堅實的基礎。

    認知大模型，「讓機器思考分析決策」。此模型能夠適應包括各類傳感器等不同類型感知數據源的輸入，實現對環境的的理解與分析。

在行業大模型層面，砭石將涵蓋諸如醫療、醫保、金融、保險、政務、養老、教育多個專業領域，這些大模型的核心價值在於為不同行業的發展提供了強大的賦能。

總結來說，基礎大模型致力於攻克技術難題，深入探索通用性與泛化性；而行業大模型則通過深度融合行業數據與知識特性，為特定行業量身打造堅實的基礎。

基礎大模型為行業大模型的建設提供有力支撐，同時，行業大模型又能夠結合實際應用場景與真實數據，為基礎大模型的進一步優化提供寶貴的反饋與滋養。

大模型堪稱人工智能領域的一座重要里程碑。

展望未來，智慧眼將秉承持續創新的精神，引領AI技術發展浪潮，推動大模型技術如高山流水般洶湧澎湃，廣泛覆蓋醫療、醫保、金融、保險、政務、養老、教育等各行各業，從而為社會發展註入全新的、高質量的生產力。---[新智元報導*編輯：編輯部/來源: 新智元]

我要留言

打通AI「任督二脈」，國產自研通用大模型「砭石」實力邁向AGI

全球首次，濕實驗證實！上交成功實現「蛋白質功能定向進化」，零數據跨入AGI時代

人形機器人：通用之戰和未解之題

全球首次，濕實驗證實！上交成功實現「蛋白質功能定向進化」，零數據跨入AGI時代

人形機器人：通用之戰和未解之題