打通AI「任督二脈」,國產自研通用大模型「砭石」實力邁向AGI
【新智元導讀】全球領先AI公司智慧眼發布了自研的通用大模型——砭石,海量代碼文本數據訓練後展現出強大的湧現能力,不僅能實現代碼生成,韻律創作,甚至是多模態AI理解效果驚人。
每一次關鍵技術取得通用化的突破,都會深刻改變生產方式,並顯著提升生產力水平,而「大模型」成為了打通人工智能技術通用性「任督二脈」的關鍵。 智慧眼,作為全球領先的人工智能企業,最近推出了其創新研發的通用大模型——砭石。
AI正在從感知智能、認知智能向決策智能快速叠代演進。
在1.0時代,感知智能中以計算機視覺為代表,即基於深度學習算法,賦能計算機理解數字圖像和視頻,智慧眼正是在這個時候構建了機器視覺大模型,並在IDC的中國人工智能之計算機視覺應用市場份額排名中進入前七,榮獲中國智能科學技術最高獎——吳文俊人工智能科技進步獎。
2.0階段,認知智能將從認知心理學、腦科學及人類社會歷史中汲取靈感,並結合跨領域知識圖譜、自然語言處理、因果推理等技術,建立穩定獲取和表達知識的有效機製,智慧眼發布了人工智能中臺和大數據中臺產品,實現了從感知智能到認知智能的跨越。
到了3.0時代,AI+X成為前沿方向,需要采用海量的高質量通用數據訓練一個基礎的底座,再針對不同的場景,利用少量的專業數據進行微調,實現低成本的AI場景落地。
智慧眼研發了通用大模型砭石,該模型基於嚴格審核過濾的海量多模態數據訓練,通過「預訓練+精調」模式帶來了新的標準化AI研發範式,實現AI模型在更統一、簡單的方式下規模化生產,支持多種任務執行。
大模型生成代碼,砭石通過對開源代碼數據集進行多次清洗,得到高質量的代碼數據集,隨後通過預訓練和CoT訓練等方式,使得大模型具有強大的代碼生成和推理能力,極大地提高了軟件開發的效率和質量。
大模型寫作能力,砭石大模型在更多參數和更復雜的結構基礎上,使用海量的通用文本型數據進行預訓練,學習了大量通用知識和邏輯,表現出了強大湧現能力和學習能力,生成了富有韻律、節奏和情感表達的詩歌。
砭石大模型基於自然對話方式理解和執行任務,提供多種能力包含文本、圖像、視頻、音頻輸入,生成式輸出文本信息,具備閑聊和知識問答能力,可以為情感陪伴、政策問答、大數據分析等場景賦能。
三大核心技術賦能,新一代大模型順勢而出
大模型的創新,遠不止於模型本身的革新,其更深層次地依賴於人工智能領域中的各項核心技術突破。
在這方面,智慧眼公司擁有顯著的優勢,其在知識圖譜、智能大模型以及隱私計算等關鍵技術上,都擁有自主研發的核心算法和獨立的知識產權,這為通用大模型創新提供了堅實的基礎。包括:
在知識圖譜方面:公司突破保護隱私的分布式知識遷移和聯邦圖譜推理,接入差異化的大規模行業數據,構建世界一流的高可信高質量的海量數據知識圖譜,為知識圖譜緩解大模型幻覺奠定基礎。
在智能大模型方面:公司突破了隱私計算條件下的大模型聯邦訓練、基於知識圖譜的大模型知識增強等核心技術,顯著提升大模型在專業領域的信息生成準確度。
在隱私計算方面:突破了保護隱私的分布式知識遷移和聯邦圖譜推理技術,實現對高價值用戶的敏感隱私數據的脫敏,真正做到數據的「可用不可見」安全應用,實現分布式知識的融合和基於分布式數據的大模型訓練,支撐了用戶數據價值的釋放。
四大基礎模型融合,共同塑造超強通用能力
智慧眼砭石大模型的核心定位是為各行各業註入新的活力,采用完全的分層解耦設計,包括兩層:
第一層為砭石通用大模型層,主要包括機器視覺、自然語言理解、多模態和認知4大基礎模型,為各種應用場景提供相關的AI基礎能力;
第二層為行業大模型,基於通用大模型層,能夠整合行業用戶的自有數據,訓練客戶的自有專有大模型。
通過這種分層次的設計,智慧眼砭石大模型不僅提供了廣泛的通用能力,還能根據各行業的具體情況,實現高度個性化的賦能。
具體來說,基礎模型層面包含:
機器視覺大模型,「為機器植入眼睛與大腦」。此模型通過在大規模圖像數據上進行訓練,可以實現各種視覺任務,能夠進行圖像的分割和識別、分析視頻等。
自然語言理解大模型,「讓機器理解人類語言」。此模型基於數T Token的高質量語料訓練而成,能夠實現負責的自然語言處理任務。
多模態大模型,「讓機器擁有豐富感官」。此模型通過對文本、圖片、視頻和音頻等不同儲存信息載體的認知和理解,來模擬人與人之間的交互方式,為創新性應用提供了堅實的基礎。
認知大模型,「讓機器思考分析決策」。此模型能夠適應包括各類傳感器等不同類型感知數據源的輸入,實現對環境的的理解與分析。
在行業大模型層面,砭石將涵蓋諸如醫療、醫保、金融、保險、政務、養老、教育多個專業領域,這些大模型的核心價值在於為不同行業的發展提供了強大的賦能。
總結來說,基礎大模型致力於攻克技術難題,深入探索通用性與泛化性;而行業大模型則通過深度融合行業數據與知識特性,為特定行業量身打造堅實的基礎。
基礎大模型為行業大模型的建設提供有力支撐,同時,行業大模型又能夠結合實際應用場景與真實數據,為基礎大模型的進一步優化提供寶貴的反饋與滋養。
大模型堪稱人工智能領域的一座重要里程碑。
展望未來,智慧眼將秉承持續創新的精神,引領AI技術發展浪潮,推動大模型技術如高山流水般洶湧澎湃,廣泛覆蓋醫療、醫保、金融、保險、政務、養老、教育等各行各業,從而為社會發展註入全新的、高質量的生產力。---[新智元報導*編輯:編輯部/來源: 新智元]