01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

這家國產大模型,又現大動作

2024070618:03

一、所有的行業都值得被AI重做一遍

「當下,所有的行業都值得被AI重做一遍。」

隨著AI技術的快速發展,不斷滲透到各行各業當中,這句話正在成為人們的共識。
事實上,回顧過去的互聯網時代、移動互聯網時代以及數智化時代,每一次新興技術出現時,「所有的行業都值得被xx重做一遍」這種類似的話總是會被反復提及,這背後其實有兩點原因:

第一,AI(新興技術的應用)能夠帶來生產力和生產效率方面的質的飛躍,對過去的傳統行業實現肉眼可見的降維打擊。

正如達里歐在《原則2》中寫道:「衰落的伏筆總是埋在黃金時代,鼎盛的主體會在傾瀉的頹勢中逐漸式微。」

微軟、惠普等個人計算機企業的大量興起導致IBM的衰退;

蘋果、華為等智能手機廠商造就了諾基亞為代表的傳統手機的消亡;

包括在數智化時代,諸多企業通過對供應鏈上下遊的優化管理實現了降本增效,從而與同行拉開差距。

這樣的故事,在每一次新技術到來後都反復上演。

第二,AI(新興技術的應用)將開創全新的應用模式與產業機遇。

需要註意的是,AI(新興技術的應用)可不僅僅是只能實現效率層面的提升。

拿蒸汽機來說,蒸汽機除了推動蒸汽輪船、蒸汽火車的出現,帶來運力的大幅度提升,緊接著帶來的是,世界的政治、經濟以及文化版圖都發生了巨大的改變;更別說之後福特流水線的誕生,帶來了製造業理念的顛覆性變革。

而正如蒸汽機技術應用於大量領域和產業,「所有行業值得被AI重做一遍」這樣一句話也已經在照進現實了。



當然,盡管說所有行業值得被AI重做一遍,我們又該如何用AI對其它行業進行重做呢?

首先可以重新認識AI,人工智能有4個階段,具體可以分為:

第一階段,性能調優。通過優化算法和技術來提高人工智能的性能;

第二階段,降本增效。將已經相對成熟的人工智能技術應用到合適的場景當中為企業和個人降本增效;

第三階段,簡單服務。即一次就能為你解決問題的服務。比如,會計、法律服務、設計師甚至是心理咨詢師,他們提供的都是單次服務,這種服務很容易被AI學會和標準化。

第四階段,復雜服務。復雜服務指的是能夠持續伴隨你、了解你並且為你提供長期個性化建議的服務。

目前來看,大部分AI或者說對人工智能的應用,還處在從性能調優,朝著降本增效及簡單服務進化的階段,在營銷、自動駕駛,及具身機器人等諸多領域AI應用其實已經顯現,我們也能看到許多相關的案例。

比如就在7月5日,2024世界人工智能大會(WAIC2024)中國電信星辰人工智能生態論壇上,中電信人工智能科技有限公司和中國電信人工智能研究院(TeleAI)聯合發布了一款名為星辰大模型·軟件工廠的多模態大模型產品。



星辰大模型·軟件工廠發布

作為全球首個針對編程(軟件開發)領域的大模型軟件,星辰大模型·軟件工廠一經發布就引起了諸多反響和行業的熱議。

有人說:「星辰大模型·軟件工廠的出現可以讓一人『成軍』。」

還有人評價到:「從軟件開發從業者的角度來看,星辰大模型·軟件工廠的出現無疑將帶來從月到天,從天到時的軟件開發範式新變革。」

那麽,星辰大模型·軟件工廠又是如何通過生成式AI(多模態大模型)給軟件開發領域帶來這種顯而易見的改變呢?

二、星辰大模型·軟件工廠 :讓AI開發更「AI」

在回答上面這個問題前,我們可以先簡單了解下軟件開發的演變趨勢:

1. 早期時代:軟件開發的起源最早可以追溯到20世紀40年代,當時的計算機程序是直接使用二進製代碼,這種編程方式低效且難以理解。

到了20世紀50~70年代,高級編程語言的誕生和結構化編程概念的形成,讓程序變得更加清晰、模塊化,極大提高了軟件開發效率。

2. 個人PC時代:20世紀80、90年代,伴隨著個人PC時代的普及,集成開發環境(IDE)和各種編程語言的編譯器等軟件開發環境和工具得到了極大的發展,我們聽過的C++、Java和Python等語言也正是這一階段開始流行的。

3. 互聯網時代:到了21世紀初,隨著互聯網普及開來,軟件開發的發展趨勢呈現出敏捷開發的特點——強調快速叠代和跨功能團隊的合作。

4. 大數據時代:這階段我們大多數人就比較熟悉了,隨著雲計算技術的快速發展,軟件開發也變得更加靈活和可擴展,微服務架構(通過將應用程序分解為一組小型、獨立的服務,提高了系統的可維護性和可擴展性)的軟件設計方式和低代碼/無代碼開發平臺進一步提高了開發效率和降低了軟件開發的門檻。

時至今日,在生成式AI技術日臻成熟的背景下,於結構化的編程語言而言,生成式AI在很多方面處理起來都更加簡單和高效,軟件開發難度和上手門檻越來越低,效率越來越高以及成本越來越低成為了一種必然趨勢。

不過必須要承認的是,當下AI開發依舊存在一些痛點:

1. 流程復雜:從端到端的應用開發包括需求分析、設計、編碼等多個復雜環節。自動化整個流程需要涵蓋廣泛的知識和處理復雜的決策邏輯,這對於目前的人工智能系統來說是一個挑戰;

2. 溝通協作成本高:軟件開發從來就不只是技術活動,還包括溝通協作、問題解決等人類因素,而這些恰恰是目前的AI技術難以覆蓋到的;

3. 需求定製化:每一個開發項目都有獨特性,包括特定的業務邏輯、技術棧、開發規範和客戶需求等,也因此要創建一個能夠廣泛適應這些個性化需求的端到端自動化工具是很困難的。

而這也正是星辰大模型·軟件工廠被推出的原因。

作為一套全新的開發工具,星辰大模型·軟件工廠是中國電信人工智能研究院以需求設計編寫為核心,通過使用語言模型生成程序代碼的基礎底座型平臺。

此外,中國電信人工智能研究院還為企業提供了從項目創建到應用、自動寫代碼、上線、更新以及後續叠代等全流程自動化應用生成等全流程工具,從而讓需求分析和業務人員可以快速搭建自身的業務應用。

可能這麽一大段描述,大家很難具體感知到星辰大模型·軟件工廠的獨特之處,這裏我可以舉個例子。

一般來說,一個軟件開發項目的過程可以分為以下幾個階段:

需求分析——產品設計——產品研發——測試部署——產品叠代(新增需求)——交付。



傳統軟件研發過程

拿產品研發環節來說,按照傳統的軟件開發流程,一般是由10~15人開發人員分成不同的小組,夜以繼日地開發、討論,想要進入下一個環節,可能需要半個月~1個月的時間;

而到了測試部署環節,測試人員需要開展單元測試、集成測試等,撰寫測試報告,並再次回到研發階段進行開發討論,修改bug,整個過程可能又需要十幾天乃至數十天。

這還沒完,產品還面臨叠代、增加需求等問題,這個環節同樣需要花費大量的精力和時間,最終等到客戶全部需求都落實,才算真正完成交付,並且整個過程還可能因為各種意外拉長開發時間戰線甚至是項目推遲。

而如果借助星辰大模型·軟件工廠進行軟件開發,無疑是把上述的所有環節在實操難度、時間維度、協作融洽度等多方面都簡單化了。

同樣的一個項目,傳統的產品研發需要15個開發員工、20天時間,借助星辰大模型·軟件工廠的生成式AI大模型,則只需要2名員工1天時間就能搞定;

再拿測試部署環節來說,星辰大模型·軟件工廠具備一鍵部署的功能,可以在完成測試的同時直接修改bug,傳統的測試部署需要數天,星辰大模型·軟件工廠可能數分鐘就完成了;同樣,在產品叠代環節,星辰大模型·軟件工廠也只需要修改PRD特定部分,就可以迅速完成部署。

可以說,在很多我們平常容易忽視的領域,AI已經在持續地改造大部分傳統業務流程,將我們的工作效率帶到前所未有的高度。

而這對於眾多中小企業老板和我們大多數人來說,是一次巨大的挑戰,但也是當下AI時代又一次拉開差距的機會。

改變正在發生,我們不能視而不見。

三、星辰大模型·軟件工廠「橫空出世」的背後,為什麽是中國電信?

在今年3月份的《哈佛商業評論》中一篇文章《人們究竟如何使用生成式AI》提了一個有趣的問題:

在全球十多億腦力勞動者當中,只有大約15%在使用生成式AI工具,那麽,剩下的85%為什麽不使用?

回答是有些人認為現階段沒有起到太大作用,有些人則因為它們經常給出錯誤的答案,還有些人認為用戶體驗不夠好。

但其實,AI從來不是新鮮事物。

自1956年達特茅斯會議上首次提出「人工智能」這一術語後,距今已有近70年的歷史。

從20世紀八九十年代的符號推理、機器學習;再到千禧年初重獲關註的深度學習,以及如今熱門的生成式AI,人工智能從最初的概念探索演變到現代技術的突破。

尤其在近十年,以卷積神經網絡(CNN)為核心的計算機視覺技術,和以大模型為代表的自然語言方向,讓AI跨入認知智能主導的時代,並加速改變傳統產業的工作模式。

截至目前,生成式AI大模型的技術能力已經滿足甚至超過了很多重復性工作的要求。但卻依舊只有約15%的腦力勞動者在使用,很顯然,問題其實出在了產品端。

所以也就不難理解星辰大模型·軟件工廠這一產品上市的意義了。

當下很多人對於所謂生成式AI或者大模型產品過於追求所謂的某一方面的極致,要顯得自己的產品有多麽的高科技,就像討論新質生產力這個概念,很多人會覺得這個概念過於「高大上」、遙不可及,但歸根結底,無論是前者,還是後者最終是要回歸到用戶本身,「下沈」到用戶中去,真正地解決用戶的痛點,降低用戶的上手門檻,為用戶帶來降本增效。

並且,你如果真要提一些硬實力或者高科技什麽的,星辰大模型·軟件工廠在這方面也是一點不虛同行的。

為什麽這麽說?

因為星辰大模型·軟件工廠背後,站著的是一整個星辰大模型家族和中國電信。

很多人可能不知道,早在去年五月中旬,經過數十版模型訓練與優化,中國電信就已經完成了百億參數星辰AI大模型版本的訓練;而後,去年11月份,又進行了叠代,完成了千億參數版本的星辰AI大模型,中國電信也憑此成為了央企中首位完成大模型研發和開源的選手。

截至今天,從最基礎的星辰語義大模型到星辰語音識別大模型和星辰多模態大模型,中國電信旗下的大模型始終保持著快速叠代,目前已經完成語義、語音、視覺等多模態大模型布局。

並且值得一提的是,這些大模型產品均處於行業領先。拿星辰語音識別大模型來說,此前其已經獲得了多個國際權威賽事冠軍。

比如在權威國際語音頂會Interspeech 2024離散語音單元建模挑戰賽的ASR賽道中,星辰語音識別大模型團隊領先於約翰霍普金斯大學、卡內基梅隆大學、英偉達等國內外知名高校與企業,一舉拿下賽道冠軍。

另外在方言識別上,星辰語音識別大模型也訓練了數十種方言能力,這意味著你以後去全國各地旅遊,如果當地的一些人用方言跟你交流,你也不用擔心聽不懂,手機裏搭載了星辰語音識別大模型就足矣。

事實上,在海內外眾多的大模型玩家中,中國電信無疑是特別的一位。

在當下這一階段,像中國電信這樣的運營商具備了諸多優勢:

首先,數據。對大模型來說,數據無疑是重中之重的,尤其是在當下,中文互聯網數據由於信息壁壘、數據孤島、大量無用信息冗余等特點存在獲取困難、質量不佳等問題。

而除去大量來自書籍、網絡辭典以及大量公開的文獻文章等通用數據,電信憑借自身過往的業務也沈澱積累了大量的行業數據。

而這使得星辰AI大模型的中文訓練數據超25TB,中文總token量更是超8萬億。

而在經過了Knesey-Ney技術過濾、Minihash+Jaccard排重,以及幾百人專業標註團隊的人工標註,這批數據也為星辰AI大模型算法訓練打下堅實基礎。

第二,算力。不論是國內大模型的迅速崛起,還是各行各業智能化轉型的加速,其實都離不開強大的算力作為支撐。在這方面,中國電信有著豐富的網絡和算力資源,在大模型建設上能夠更容易發揮規模的優勢。

比如支撐起整個星辰大模型家族的是星河AI平臺,它是全球首款以雲網融合為核心架構,搭載「全網、區域、邊、端」四級算力,擁有31個省級算力集群的人工智能產品和能力平臺,可以實現AI能力一鍵下發、快速部署、全場景應用。

簡單來說,就是來自集團的2大核心算力集群(包含近萬臺GPU)與31個省級算力集群(同樣近萬臺GPU)進行雲邊端協同,實現算力資源全國統籌調度管理,可以說完全不用擔心中國電信會遇到算力不足的情況。

第三,強大的科研團隊。值得一提的是,在2024世界人工智能大會(WAIC2024)中國電信星辰人工智能生態論壇上,除了發布星辰大模型·軟件工廠,中國電信人工智能研究院(TeleAI)在論壇上也正式揭牌,AI領域Fellow大滿貫科學家李學龍擔任院長。



中國電信人工智能研究院(TeleAI)揭牌儀式

此外,中國電信已經組建了一支近800人的研發團隊,由李學龍教授親自牽頭,不斷開展基礎、前沿研究。作為央企在AI領域的主力軍,TeleAI正在成為人工智能領域的國家戰略科技力量。

第四,中國電信有龐大的客戶群體,以及豐富的2C、2H、2B的信息服務業務。這意味著中國電信能夠更快地推動人工智能大模型在各個領域的落地,形成新的經濟增長點。

目前,中國電信已打造出基礎模型+行業模型+應用模型的布局,除了自研本身,還采取了生態合作的方式,聯合頭部生態構建了涵蓋教育、政務、應急等32個行業大模型,覆蓋全行業500多個應用場景。

新技術的繁榮,註定是源自於應用和場景的繁榮。

兩年前的今天,我們還很難想象AI具體能帶來什麽。

但時至今日,我們看到AI不僅可以創作文字、圖片、視頻,還逐漸應用到了辦公、編程、無人駕駛以及具身機器人等各個行業,並且始終保持著一往無前的姿態,顛覆著我們的想象和未來。

四、結語 :一切才剛剛開始

「強大人工智能的崛起可能是人類遇到的最好的事情,也可能是最壞的事情,但我們還不知道答案。」

物理學家霍金在生前講過這樣一句話。

這句話放在現在依舊是那麽的合適。可以說,人類和AI呈現一組統一與對立的矛盾關系:

人類創造AI、控製AI、受益於AI,但又始終警惕AI、恐懼AI。

在《終結者》系列、《黑客帝國》系列以及《銀翼殺手》系列等無數的科幻作品中,我們始終能看到這種矛盾復雜的感情。

是否有一天,人類終將會被AI取代?

這可能是當下很多人都會在腦海裏冒出來的一個問題。

好比地球是一本期刊,從遠古到農業革命到工業再到信息革命,人的影響因子在這個過程中是一個不斷被放大的過程,逐漸演進的科學技術是一個杠桿,人類永遠站在不斷延長的那一側,撬動著整個地球。

而到了AI時代,當人工智能一腳把人類從杠桿的一側踢開,自己站上去時,地球這本期刊,人的影響因子還會不斷放大嗎?

當然,現階段來看,這個問題還顯得有點遙遠,甚至是杞人憂天了。

事實上,一切才剛剛開始,而我們所能做的就是,不要溫和地走進那個良夜,而是學會擁抱AI,擁抱星辰大海。

讓自己始終留在牌桌之上,而不是被時代的列車拋下。

---[排版: 沈望望*編輯: 微瀾*輪值主編: 夏昆/作 者:微瀾/來 源:正和島]