01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

“百模大戰”下半場開打,平台將成關鍵

2023110916:20



離大模型走進人們的視野已經過去近一年的時間,在AI大模型的浪潮下,各大科技企業爭先恐後的推出了各自的大模型産品。與此同時,各行業企業也對大模型保持著高度關注。

如果說,各大廠商紛紛推出大模型産品形成“百模大戰”的局勢,是大模型這場“戰役”的上半場的話,那麽這場“戰役”的下半場將更聚焦在大模型産品的整合能力,以及平台化、行業化的發展方向。

下半場開打,平台化、行業化將成關鍵賽道

從大模型這一年的發展可以看出,目前各個廠商的大模型幾乎是“各自爲戰”,都通過自身的産品意圖搶占更多的市場,以大模型“鼻祖”ChatGPT爲例,ChatGPT是個應用,可以看作一個APP,而GPT4則是個大模型,構建了類似大模型的生態,讓企業可以以此爲基礎,打造自身的大模型。

從上述案例可以看出,過去近一年的時間,各家都將主要精力放在類似“ChatGPT”的産品打磨上,落地點在應用側,而對于企業側而言,目前行業還是較缺乏一個平台,讓企業可以靈活調用各家大模型産品,或者基于某家的産品開放針對自身需求的大模型。在神州數碼副總裁CTO李剛看來,大模型如果想要在企業側實現應用的爆發,需要一個,甚至多個開源、開放的大模型平台。

說到企業級大模型應用,就不得不提一提行業大模型,钛媒體觀察發現,目前行業級大模型還處于發展的初級階段,雖然有很多家企業推出了行業大模型,但是應用並不很好。

以發展較快的金融行業爲例,今年3月,彭博首度針對金融業推出大型語言模型BloombergGPT,引發市場對金融垂直領域大模型的關注;6月,哥倫比亞大學聯合上海紐約大學推出FinGPT 。

在國內,7月,華爲全新發布盤古大模型,金融行業大模型正是其中數個行業通用大模型之一;9月,螞蟻集團正式發布自研“螞蟻基礎大模型”,以及在此基礎上進行定制的“螞蟻金融大模型”。

李剛對钛媒體表示,目前市面上的大模型種類主要分爲幾類,一類是通用的基礎大模型,一般來說,這些大模型通過自然語言的語料構建數據庫,經過清洗、訓練等操作,打造了基礎大模型,“這類模型,語料庫越大、參數量越大,能力就越強。”李剛表示。

另一類就是行業大模型,這類模型具有極強的專業性,需要大量行業專業知識庫,“目前,這個行業知識庫的語料需控制在20%,不多不少。”李剛強調,“超過20%,訓練出來的大模型可能就‘不會說人話’,造成溝通障礙;少于20%,又不具備行業的專業性。”

打造大模型的“PaaS”層

就像雲計算有IaaS、PaaS、SaaS之分一樣,在神州數碼戰略營銷部總經理皇甫子喬看來,大模型時代,企業也需要一個類似雲時代PaaS平台。

爲了給企業構建一個更好使用大模型的平台,神州數碼近日正式發布了神州問學平台,談及平台發布的意義時,李剛對钛媒體表示:“以神州問學平台爲核心,我們不做基礎大模型,而是做大模型的集成與應用開發交付平台,從而加速企業AI創新;我們做大數據的服務夥伴,從而加速企業數據治理升級;我們做生態紐帶、模型市場、數據集市、應用商店,從而加速産業創新與生態破局。”

今年初,華爲雲發布了盤古大模型,並將大模型按照L0、L1、L2進行了分級。按照華爲雲的分類,L0指基礎大模型,L1指行業大模型,L2則是指面向更加細分場景的推理模型。

基礎大模型方面,以圖網絡大模型爲例,一個大模型可以適配工藝優化、時序預測、智能分析等多個場景,同時應用在金融、煤礦、制造等多個行業。

行業大模型方面,華爲雲推出了如盤古金融大模型、盤古礦山大模型、盤古電力大模型、盤古制造質檢大模型、盤古藥物分子大模型等行業大模型。

推理模型方面,以在電力行業爲例,華爲雲基于盤古電力大模型,針對無人機電力巡檢細分場景,通過一次預訓練+下遊任務的微調,推出盤古電力巡檢大模型,解決了無人機智能巡檢系統(缺陷檢測)中的小樣本學習、主動學習、增量學習等問題,解決了海量數據標注工作量大和缺陷種類繁多的問題。

上述是華爲雲對于大模型的理解,以及華爲雲的一些産業布局。基于此,皇甫子喬對钛媒體表示,神州數碼問學平台在幫助企業從L0到L2行業應用場景落地過的程中,將起到“轉換器”的作用,“爲企業提供一個類似雲計算時代PaaS平台的能力。”皇甫子喬如是說。

無獨有偶,百度CTO王海峰也曾公開表示,面對大模型産業化的挑戰,行業需要類似芯片代工廠模式,采用“集約化生産,平台化應用”的模式,即具有算法、算力和數據綜合優勢的企業將模型生産的複雜過程封裝起來,通過低門檻、高效率的生産平台,爲千行百業提供大模型服務。

據钛媒體了解,目前,這一産業化路徑已在文心大模型産業實踐中得到驗證,百度與各行業頭部企業、機構共建了包括能源、金融、航天、制造、傳媒、城市、社科以及影視等行業大模型。

更低成本、更低門檻是目標

雖然大模型已經逐漸向各行各業滲透,但就現階段大模型發展來看,對于企業級用戶而言,大模型的使用成本依然讓很多企業望而卻步。

以GPT-3爲例,英偉達曾披露訓練一次1750億參數的GPT-3需要34天,使用1024張A100 GPU芯片,單次訓練成本高達1200萬美元。爲了訓練超大規模的AI模型,微軟甚至爲OpenAI構建的一台排名世界前五的超級計算機。

與此同時,據國盛證券《ChatGPT 需要多少算力》報告估算,大模型的前期訓練成本很高,一次訓練的成本超過百萬美元。這個費用不僅涵蓋了模型的架構、算法和訓練數據的選擇,還包括了模型訓練所需要的大量計算資源和時間成本。而且隨著大模型版本的升級,其訓練成本也呈幾何式增長。

百度創始人、董事長兼首席執行官李彥宏也曾指出:“無論是哪家公司,都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學習、自然語言處理,需要多年的堅持和積累,沒法速成。”

面對如此高額的大模型使用成本和使用門檻,是一般企業承擔不起的,也正是如此,目前爲止,還沒有一個真正意義上完善落地的行業大模型産品面世。

對此,皇甫子喬表示,大模型的使用成本是很多企業應用大模型賦能業務的最大阻礙,而神州問學平台的定位就是希望通過開源的形式,讓企業以更低的選擇成本,使用大模型産品。“神州問學主要包含兩個部分,一部分是平台,另一部分是開箱即用的場景應用。”皇甫子喬對钛媒體表示,“這兩部分一方面希望集合更多生態夥伴,共同賦能用戶;另一方面,希望企業可以更快、更便捷的使用大模型産品。”

將大模型的使用成本和使用門檻降低是行業內的共識,無論是“一卡難求”的GPU,還是高額的電費,都是現階段企業應用大模型的門檻,而諸如神州問學、百度千帆、昆侖萬維等,“風格迥異”,卻目標相同——“助力大模型落地”的平台級産品的湧現,以及大模型生態中合作夥伴的不斷增加,企業應用大模型的門檻和成本必將進一步的降低,我們離行業大模型的普惠也將越來越近。-钛媒體-