行業大模型快速落地的一年,如何做?
生成式AI正成為時下科技企業「講故事」的關鍵詞之一。但從發展上看,無論是「文生文」的大語言模型,還是「文生圖」的多模態模型,更多的是輔助人們進行一些簡單的辦公,或者提供一些娛樂,其面對的群體主要是終端的用戶。
消費側的應用僅是AI大模型的冰山一角,大模型真正的價值則是在行業側、企業側的應用,據市場研究機構預測,到2025年,全球生成式AI市場規模將達到100億美元以上。其中,企業級生成式AI市場將占據相當大的份額,成為最大的應用領域之一。
從行業大佬們的發言中也能看出一些相似的觀點。浪潮集團執行總裁、總工程師、浪潮雲董事長肖雪曾表示,以大模型「新技術」釋放數據「新要素」價值,推動數實融合,賦能千行百業,打破傳統生產要素「質態」,提升經濟社會發展「質效」,促進社會「生產力」實現新的躍升;IBM 大中華區董事長、總經理陳旭東曾公開表示,企業級AI應用相較於消費側,有着更廣泛的需求和潛力.....
數據質量已成大模型落地關鍵
隨着互聯網、物聯網等技術的發展,數據資源呈現爆炸式增長。而2023年底多部委聯合印發的《「數據要素×」三年行動計劃(2024—2026年)》(簡稱《行動計劃》)更是凸顯了國家層面對於數據的重視程度。
《行動計劃》以推動數據要素高水平應用為主線,以推進數據要素協同優化、復用增效、融合創新作用發揮為重點,強化場景需求牽引,帶動數據要素高質量供給、合規高效流通,培育新產業、新模式、新動能,充分實現數據要素價值,為推動高質量發展、推進中國式現代化提供有力支撐。
大模型作為新產業、新動能的一部分,數據也是大模型訓練的關鍵,企業通過收集、整理和分析數據,為大模型提供了豐富的「燃料」。對此,浪潮雲總經理顏亮對鈦媒體表示,過去,在應用層面,數據很難發揮出共享、流通以外的更大價值,「通過大模型的加持,尤其是行業大模型的不斷湧現,整個數據產業將發生質的改變。」顏亮指出。
顯然,從現階段企業數據質量角度來看,企業進行數據治理的水平參差不齊,絕大多數企業數據質量較低。現階段,對於絕大部分企業而言,企業內部有60%~70%的內部數據未被使用,企業若能將這部分數據加以利用,這些數據將進一步驅動企業業務發展,對此,阿里巴巴集團副總裁、瓴羊CEO朋新宇曾在由鈦媒體集團與ITValue聯合主辦的「2023 ITValue Summit 數字價值年會」上表示,現階段大多數企業不具備數據驅動的能力,造成了企業數據應用不足的現狀,「不過與數據應用相比,缺乏數據治理能力的企業更多。」朋新宇指出。
隨着越來越多行業大模型應用的落地,數據的質量和多樣性也得到了提升,使得大模型能夠更好地適應不同的應用場景。在顏亮看來,大模型在「數據要素×」的戰略推進過程中,將起到催化劑的作用,「通過行業大模型的應用,能讓更多的企業更快地感受到數據帶來的價值,」顏亮如是說,「當更多企業切實感受到數據的價值後,就對企業自身的數據愈發重視,從而進一步推動了企業的數據治理,提升了企業數據質量。」
可信賴、易落地、可持續,行業大模型的三大核心要求
雖然數據是大模型的「燃料」,沒有高質量的數據就訓練不出優秀的大模型,但是數據質量只是大模型落地的第一步,如何打造一個能用、好用,能一直好用的大模型,是當下企業與大模型服務提供商關注的焦點。
可信賴層面,因為大模型的訓練會涉及海量的數據,尤其是行業大模型,需要針對不同企業,不同業務場景,使用企業獨有的數據進行大模型的訓練。在這個過程中,如何確保企業的數據不出域,確保企業數據安全,成為當下亟待解決的問題之一。
對此,顏亮表示,在應用大模型產品的過程中,企業更傾向於本地部署,同時要具備可靠的安全能力,對企業的數據形成有效的保護,「數據安全問題是企業選擇大模型產品過程中,首要考慮的問題。」顏亮強調。
無獨有偶,IEEE標準協會理事兼IEEE數字金融與經濟標準委員會主席林道莊也有着相似的看法,林道莊曾對鈦媒體表示,在AI時代,企業面臨着更大的網絡安全和數據安全的挑戰,尤其集中在數據泄露、數據篡改/偽造等數據安全方面的挑戰。
針對此,未來,大模型的發展將更加注重數據隱私和安全,企業需要採取一系列的安全措施和技術手段,如加強數據加密和訪問控制、建立安全審計和監控機制、採用對抗性防禦技術提升模型的穩健性、完善隱私保護政策和機制等。而在這個過程中,諸如加密學習、聯邦學習、隱私計算等技術將會成為企業應用行業大模型過程中的得力助手。
易落地層面,在這個唯快不破的時代,簡單易用、快速落地的數字技術將受到更多企業的青睞,在顏亮看來,易落地是解決大模型快速在行業側體現應用價值的關鍵能力。從現階段企業應用大模型能力的方式來看,主要有三種,即:嵌入軟件、API調用和自建企業級AI平台。
雖然嵌入軟件是部署最快的一個,但是差異化能力極低,沒法更好地適配企業業務場景,所以從企業角度出發,企業應用API調用+自建平台的形式無論從短期出發,還是從長遠角度出發,都是企業應用大模型能力的最佳選擇。
從大模型服務供應商角度出發,服務商需要具備一定的基礎模型能力,其次要具備充實的算力資源能力,最後還要具備大模型引擎的能力。針對此,浪潮雲首席技術官孫思清對鈦媒體表示,基於分布式雲架構開發的大模型產品將成為行業大模型落地的重要渠道。
孫思清指出,採用分布式的架構可以在模型的預訓練環節採用集中式的方式,在交付的時候,通過本地化的能力,結合本地數據,更好地保護企業隱私,即滿足了企業對於安全合規的需求,又將模型的能力最大化地激發出來。
可持續層面,絕大多數行業的企業對於業務的持續性有着較高要求,而持續性的要求也映射到這些企業選擇數字技術服務業務的過程中,這就對行業大模型提出了穩定性、連續性的要求。對此,顏亮表示:「在大模型訓練和使用過程中,不能出現中斷的情況。
原來我們是為雲和數據平台做保障,現在要為大模型平台做保障,要讓用戶有非常好的大模型體驗感,如果推理過程出現持續性的間斷,推理速度慢,得不到快速響應等問題,對於企業用戶而言,賦能的體驗是體現不出來的,而我們依託在全國布局的三個運行指揮中心,可以支撐對用戶的持續運營。」
除此之外,可持續性還應該體現在模型的迭代和更新上,服務商所提供的模型不能是「與世隔絕」的,要與時俱進,這一點,採用分布式的架構,採用本地與雲端「兩條腿走路」的優勢也就顯現出來了,企業可以根據需求的變化,以及數據的更新,快速的對大模型產品進行更新,從而更好地賦能業務發展。
快速發展的一年
大模型作為驅動新質生產力的重要底座,必將與行業深度融合。而2024年在多方面的共同努力下,對於行業大模型而言將是快速發展的一年,林道莊曾對鈦媒體表示,目前,大模型的應用主要集中在「三產」(服務業)居多,主要是輔助人工作,而行業級的大模型有望在服務業相關領域率先落地成熟度較高的應用。從現有的應用情況來看,醫療、交通、政府等多個行業有望率先實現較成熟的應用落地。
以醫療行業為例,通過行業大模型對大量醫療數據的學習和分析,可以自動識別病變特徵,輔助醫生進行疾病診斷,提高診斷準確率與診斷效率。對此,顏亮對鈦媒體表示,浪潮雲推出的海若大模型產品就在醫療行業深耕布局,通過診療記錄、入院記錄等信息,直接生成病歷,省去了醫生填寫記錄的時間,「最多可為醫生省去20%的時間。」顏亮如是說。
無獨有偶,林道莊也曾表示,現階段,中國醫療資源比較緊缺,許多人排了很久的隊才能看上病,而醫生也很忙,通過大模型的輔助,能幫助醫生快速的識別諸如X光片、CT等病歷,從而大幅提升醫生工作效率,也能降低患者等待的時間。
除「增效」以外,大模型在醫療行業的落地還可以幫助患者和醫院實現「降本」,通過自動化和智能化的醫療輔助系統,可以降低醫療成本,提高醫療服務的效率和質量。
另一方面,行業大模型在醫療行業還可以幫助醫生優化治療方案。通過大模型對對患者病情、病史、藥物過敏等情況進行綜合分析,為醫生提供更加全面和個性化的治療方案,提高治療效果。
在政務方面,隨着數據要素市場化進程的推進,大模型的應用讓越來越多的企業迫切的需要更多同行業的優質數據,也間接推動了數據要素市場化的進程。
浪潮雲積極探索政務大模型在公文寫作、基層減負等場景的落地,實現基層材料整理效率提升100倍,回復準確率提升至75%;除此之外,在金融方面,大模型也有着很多用武之地,金融行業不同於其他行業,其監管要求極高,從技術上看,像貸款審核等業務其實已具備初步落地的技術能力,但因為安全合規的要求,大模型只能在其中起到解放生產力的輔助作用。
現階段,大模型在金融行業的應用主要還是集中在風險評估和管理,以及知識圖譜平台搭建方面。在風險評估方面,大模型可以通過分析大量的歷史數據和實時信息,預測市場風險、評估信用風險等,為金融機構提供更加準確和及時的風險管理決策支持。
另一方面,將大模型與知識圖譜平台結合,用大模型代替NLP技術,金融機構可以在提升效率的同時,提升風控水平。
從現有的應用來看,醫療、政府和金融是眾多大模型服務商重點布局的領域,而其他包括製造、交通、農業、應急等在內的多個行業也有望在今年實現大模型應用成熟落地。
大模型落地方興未艾。可以預見,2024年,行業大模型必然是各行各業關注的焦點,未來也會有越來越多的應用落地。在新技術的熱潮中,企業不會缺席大模型落地應用的探索,但成效不是一蹴而就,夯實根基、理性決策才能穿越技術成熟的周期。---(鈦媒體/作者:張申宇)