01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

開源11天,馬斯克再發Grok-1.5!128K代碼擊敗GPT-4

2024032917:13


【新智元導讀】馬斯克「搞笑」模型剛剛升級到Grok-1.5,推理性能暴漲,支持128k長上下文。最重要的是,Grok-1.5的數學和代碼能力大幅提升。

Grok-1官宣開源不過半月,新升級的Grok-1.5出爐了。

剛剛,馬斯克xAI官宣,128K上下文Grok-1.5,推理能力大幅提升。

並且,很快就會上線。



11天前,Grok-1模型的權重和架構開源,展示了Xai在去年11月之前取得的進展。

Grok-1有3140億參數,是Llama 2的4倍大,而且采用的是MoE架構,8個專家中2個是活躍專家。



Xai介紹,也就是從那時起,團隊改進了最新模型Grok-1.5的推理和解決問題的能力。



OpenAI前開發者關系負責人表示,從xAI重大發布的時間可以看出他們前進的步伐和緊迫感。令人振奮!



128K上下文,Grok-1.5數學推理能力暴漲

根據官方介紹,Grok-1.5改進了推理能力,上下文長度爲128K。



Grok-1.5最顯著的改進之一是,它在編碼和數學相關任務中的表現。

在測試中,Grok-1.5在數學基准上取得50.6%的得分,在GSM8K基准上獲得了90%,這兩個數學基准涵蓋了從小學到高中的各種競賽問題。

此外,在評估代碼生成和解決問題能力的HumanEval基准測試中,Grok-1.5獲得了74.1%的高分。

從下圖中,與Grok-1相比,可以看出Grok-1.5在數學方面的能力得到大幅提升,GSM8K上從62.9%改進到90,MATH上從23.9%提升到50.6%。



128K長語境理解,擴增16倍

Grok-1.5另一全新特點是,能夠在其上下文窗口內處理高達128K token的文本。

這使Grok的內存容量,增加到以前上下文長度的16倍,從而使它能夠利用更長的文檔中的信息。



此外,新模型還可以處理更長和更複雜的提示,同時在其上下文窗口擴展時仍保持其指令跟隨能力。

在Needle In A Haystack(NIAH)評估中,Grok-1.5 展示了強大的檢索能力,可檢索長度達 128K 字節的上下文中的嵌入文本,並取得了完美的檢索結果。

Grok-1.5基礎設施

Grok-1.5構建在基于JAX、Rust和Kubernetes的定制分布式訓練框架之上。

這個訓練堆棧可以讓xAI團隊能夠以最少的投入,大規模構建創意,以及訓練新的架構。

在大型計算群集上進行訓練LLM的一個主要挑戰是,最大限度地提高訓練任務的可靠性和正常運行時間。

xAI定制的訓練編排器,可確保自動檢測有問題的節點,並將其從訓練任務剔除。

與此同時,他們還優化了檢查點、數據加載和訓練任務的重啓,以最大限度地減少發生故障時的停機時間。

xAI表示,Grok-1.5將很快提供給早期測試者,以幫助改進模型。

博客還預告了Grok-1.5將在未來幾天裏推出幾個新功能。

最後,xAI還是一如既往地po出了招募信息。---[新智元報導*編輯:桃子 好困/來源: 新智元]



參考資料:https://x.ai/blog/grok-1.5