01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

從政策角度推演大國競爭下的AI產業發展機遇

2023072816:21



一、人工智能:引領未來的科技革命

人工智能產業包括基礎層、技術層和應用層三個層次。基礎層主要負責提供數據和算力支 持,包括 AI 芯片、智能傳感器和雲服務等領域,構成人工智能發展的基石。由於發展起 步較晚、資金支持不足、美西方技術管控等原因,我國在基礎層面臨較多「卡脖子」問題, 實力相對薄弱。技術層主要負責提供算法及技術實現。憑藉對數據資源和運算平台機器學 習技術的應用,以及計算機視覺、自然語言處理和語音識別等應用技術的發展,我國在技 術層正處在上升期。應用層是人工智能的產業鏈下游,針對不同行業和領域提供產品、服 務和解決方案,催生出多樣化的商業模式。

算力、算法和數據是驅動人工智能發展的「三駕馬車」。算力是人工智能發展的物理載體, 支撐數據通過算法實現價值釋放。2012 年後,傳統的摩爾定律已被指數式爆發的算力需 求所改寫,頭部 AI 模型訓練的算力需求每 3-4 個月倍增,對 AI 芯片性能要求「水漲船高」。 算法是實現問題解決和特定功能的指令和程序,通過開發數據智能提供通用和細分領域的 技術支持。算法沉澱在 AI 人才上,據人社部發布的《人工智能工程技術人員就業景氣現 狀分析報告》,2025年我國AI人才缺口將達1000萬,其中對算法人才的需求度高達80%。 數據是人工智能賴以發展的資源要素,為各式算法提供海量訓練以覆蓋更多的應用場景並 提升模型性能。憑藉龐大的移動互聯網和數量可觀的網民,我國在數據規模上占據比較優 勢,但大模型所需的數據更需「煉化」,數據確權和商業化仍待補足。

人工智能三要素影響政策框架選擇和中美競合。各國在算力、算法和數據的相對比較優勢 影響着其政策取向,具體包括以下幾種場景: 1、算力>算法/數據:算力如此重要,以至於承載算力的 AI 芯片技術的流失難以接受,以 出口管制為代表的政策槓桿成為保持本土核心競爭力的重要方式。 2、算法>算力/數據:算法人才作為驅動算法更新迭代的源泉意義凸顯,出於留住本土人 才和吸引外來人才的考量,教育支持和人才方面的排他性政策或被實施。 3、數據>算力/算法:海量數據收集及應用中的隱私等派生問題需發揮政府作用,同時市 場規模優勢提供了人工智能成果加速落地的有利條件。

二、政策推演:人工智能大國戰略角逐

2.1 美國的人工智能相關政策

2.1.1 多點發力支持人工智能發展

戰略規劃指引密集出台。實際上,美國較早注意到了人工智能發展的戰略意義。2018 年, 美國成立了「人工智能國家安全委員會(NSCAI)」,旨在為總統和國會提供政策諮詢,以 「促進人工智能、機器學習和相關技術的發展,以全面滿足美國的國家安全和國防需求」。 該委員會發布的一系列報告中強調了 AI 在大國競爭中的關鍵作用,並指出美國各政府部 門需要通力合作,在人才、硬件等多個方面發力,提升美國人工智能產業的競爭力。 在此背景下,美政府近年來密集推出了一系列人工智能相關的重要文件。其中,奧巴馬、 特朗普和拜登三屆政府的人工智能國家政策各有側重,但均強調保持美國在技術競爭、國 家安全方面的優勢,尤其是在與中國的競爭方面。 1、奧巴馬政府:聚焦人工智能的重點領域和潛在影響,以可持續的戰略規劃奠定美國人 工智能發展的基礎。 2、特朗普政府:將人工智能上升至國家安全的重要地位,從關鍵技術、情報領域和國防 應用等多點發力,以維持美國在全球人工智能發展的主導地位。 3、拜登政府:加大人工智能領域的投資和基礎設施建設,強化與盟友間的合作,兼顧人 工智能的安全監管。

大力投資加快科技迭代和應用落地:美國注重為人工智能發展注資,尤其是國防科技應用 研究。《2019 財年國防授權法案》要求美國防部協同各研發機構加強人工智能的軍事應用, 並成立國家人工智能安全委員會和聯合人工智能中心,統籌研究和戰略執行工作。2019 年 2 月,美國防部發布《美國國防部人工智能戰略摘要》,此後美軍人工智能領域 6.1+6.2 類的經費投入大幅抬升,2012-2022 年複合增速達 14%。從投資結構來看,2020 財年以 來投資經費的一半以上均用於應用研究,重點技術方向為第三波人工智能(主要為基於語 境推理和解釋性模型的人工智能)。 此外,美國多部法案還公布了人工智能的支持細節。根據《無盡前沿法案》,美國將以五年為周期向人工智能等戰略領域注資超 1000 億美元。2022 年 9 月,《CHIPS 法案》提出 向半導體行業提供 527 億美元的資金支持,向企業提供 240 億美元的投資稅抵免,向人 工智能、機器人技術、量子計算等前沿基礎和應用研究提供 2000 億美元的科研經費支持。 隨着人工智能的戰略意義凸顯,美國強大的資金支持既有助於帶動 AI 芯片技術的更新迭 代以滿足日益增長的算力需求,又縮短了科技成果轉化鏈條,加速了 AI 科技成果的落地 應用。

STEM 教育輸送高質量算法人才:加大對 STEM 教育的投入是美國增強 AI 產業競爭力的 重要措施。早在布什政府時期,《美國競爭法》、《學術競爭力委員會報告》等政策文件在 STEM 師資培養、階段劃分和評估標準等方面提供支持,STEM 教育逐漸上升至國家戰略, 成為美國培養科技人才、保持全球競爭力的重要依託。2020 年 2 月,OSTP 發布《美國 人工智能倡議首年年度報告》,指出計算機科學是 STEM 的重點,要使美國工人及聯邦政 府員工掌握充分調用人工智能的能力。隨着政策支持接續推進,美國計算機科學的師資力 量不斷擴充,2011-2021 年增速達 39%。與快速擴張的師資隊伍相對應的是美國 AI 人才 數目,在清華大學等聯合發布的2022年全球人工智能最具影響力學者榜單中,美國以1146 人(57.3%)獨占鰲頭,遠超中國同期的 232 人(11.6%)。

數據確權和商業化夯實發展根基。美國注重數據的開源及商業化應用,採取以市場化為導向的數據開發利用模式。從權利與 義務規定來看,2018 年出台的《澄清合法使用境外數據法》以「數據控制者模式」取代 「數據存儲地模式」,澄清了服務商境外數據訪問和調取的合法性。從政府數據開源來看, 以 2018 年出台的《開放政府數據方案》為代表,美國政府注重將透明、可靠、可互動的 高質量政府數據提供給私人部門決策使用,以將數據價值最大化利用。數據價值的實現還 得益於美國發達的數據交易市場,根據 On Audience 平台顯示,美國作為世界上最大的數 據市場,2021 年市場規模已達 306 億美元(同比增長 24.1%)。

同時美國政府也關注到數據開放帶來的隱私安全等問題,雖然目前美國並無獨立全面的隱 私保護法,但以《加利福尼亞州消費者隱私法案》為代表,已有五個州對個人數據使用的 權利和義務做出了具體規定,同時以《電子通訊隱私法案》、《金融消費者保護法》等為代 表的行業立法也為數據的安全使用提供了保障。2022 年 6 月,參眾兩院發布了《美國數 據隱私和保護法案》草案,在立法思路上更重視效率,將企業區分為「第三方」、「數據收 集第三方」和「數據服務提供商」,建立起數據規模和企業權責掛鈎的良性機制,賦予數 據處理者更大自由度。

2.1.2 發展導向的人工智能監管

美國一直重視人工智能技術的發展,並較早通過法律法規對人工智能進行監管。2020 年 1 月,白宮發布了《人工智能應用監管指南》,該指南從監管和非監管兩個層面提出了人工 智能應用的相關原則和建議,並針對通用或者特定行業人工智能應用的設計、開發、部署 和操作提出了若干監管原則。去年以來,美國聯邦政府陸續推出了《人工智能權利法案》 藍圖、《人工智能風險管理框架》等關鍵文件,對人工智能治理的原則進行了進一步的定 義和闡釋,但尚未出台具有法律約束力的規則。

目前來看,美國人工智能監管機制有以下三個特點:首先,強調監管應有助於創新與發展。通過對美國會立法與政府文件的解讀可以發現,美 國發展人工智能技術的目的是在科技、產業等領域維護美國的全球領導地位,人工智能監 管亦服務於這一根本目的,其監管政策的核心訴求是建立穩健的創新生態系統,降低人工 智能技術發展和應用面臨的障礙,並持續促進技術和創新的進步。 其次,強調輕監管原則。目前美國聯邦政府對人工智能的監管很大程度上遵循着「非必要 不監管」的思路,側重不具有法律強制性的措施,包括提出細分領域的政策指南或框架、 推動試點項目和實驗,以及設立行業內自願的共識標準等。同時,美政府在《人工智能應 用監管指南》、《人工智能權利法案》藍圖等文件中並未設立嚴格的監管機制,而是要求各 政府部門對人工智能創新和應用帶來的影響進行充分評估,避免採取可能給人工智能創新 和發展施加過高標準的預防性路徑。

第三,立法層面,美國國會針對人工智能監管的立法處於早期階段,尚無有效的監管法律 出台。目前國會兩院尚未通過任何重要的人工智能管制立法,已有提案關注人工智能算法 透明度、為政府監管機構設定目標、防範人工智能算法歧視等議題,其中較大比例的提案 集中在要求美政府建立人工智能管理機構,研判人工智能對社會治理、國家安全等領域的 影響。針對近期廣受關注的生成型人工智能,目前國會還處於相對緩慢的接受過程中,部 分有計算機背景的議員表達了對生成型人工智能應用不受監管的擔憂,亦對如何防範數字 內容偽造有所討論。

2.2 中國的人工智能相關政策

2.2.1 政策支持體系日趨完善

頂層設計指引發展。早在 2015 年,《中國製造 2025》便提出以智能製造為主攻方向,推 動信息技術與製造業融合發展。2017 年是中國人工智能發展元年,《新一代人工智能發展 規劃》的正式出台明確了我國人工智能產業發展的路線,釐清了我國人工智能發展的基本 原則、戰略目標和重點任務。規劃制定出人工智能產業 2020 年、2025 年及 2030 年的「三 步走」目標,提出了從人工智能技術和應用水平與世界先進水平同步到領先、再到建立成 為世界主要人工智能創新中心的宏偉藍圖。

政策叢林輪廓初現。隨着頂層設計的完善,2017 年以來國務院和各部委關於人工智能人 才培養、平台建設和應用等落地方面的支持政策暖風頻吹,形成了全方位的「政策叢林」。 1、人才培養:2017 年 12 月頒布的《高等學校人工智能創新行動規劃》提出人工智能人 才培養在 2020-2030 年「三步走」的戰略目標,夯實人工智能發展的智能化底層。2020 年 1 月,相關政策接續出台,基礎理論人才與「人工智能+X」複合型人才並重的培養體 系和深度融合的學科建設和人才培養模式成為重點。 2、平台建設:2019 年 8 月,科技部印發《國家新一代人工智能開放創新平台建設工作指 引》和《國家新一代人工智能創新發展試驗區建設工作指引》,承載人工智能前沿科技發 展的企業平台和試驗區先試先行,應用牽引、企業主導、市場運作的人工智能發展得到有 效支撐。 3、應用落地:2022 年 7 月,《關於加快場景創新以人工智能高水平應用促進經濟高質量 發展的指導意見》出台,依託於國內海量數據和統一大市場的內源驅動,我國積極拓展人 工智能的各類場景應用,設計場景系統、開放場景機會、完善場景創新生態,並發揮其在 賦能實體經濟高質量發展中的重要作用。

各地積極響應落實。在中央部委的支持下,各地結合區域經濟發展、產業基礎等因素出台 了差異化的人工智能發展方案,其中走在先列的是北京市和上海市。 北京市早在 2018 年的《北京人工智能產業發展白皮書(2018 年)》便摸清了人工智能產業 的底數。2023 年 5 月,《北京市加快建設具有全球影響力的人工智能創新策源地實施方案 (2023-2025 年)》和《北京市促進通用人工智能創新發展的若干措施》相繼出台,明確 了人工智能核心產業規模突破 3000 億元、保持 10%以上增長的總體目標,同時在算力、算法、數據三大要素等方面提出具體措施。 上海市在 2017 年頒布的《關於本市推動新一代人工智能發展的實施意見》制定了 2020 至 2030 年人工智能產業發展目標,通過全面實施「智能上海(AI@SH)」行動,將人工 智能技術打造為上海「四個中心」建設的發展引擎。2022 年 10 月,《上海市促進人工智 能產業發展條例》出台,全面覆蓋科技創新、產業發展、應用賦能、安全治理等多個領域, 上海市打造世界級人工智能產業集群的思路更加清晰。

2.2.2 監管強化方向清晰明確

近年來,圍繞人工智能監管,我國已出台了《新一代人工智能治理原則:發展負責任的人 工智能》、《國家新一代人工智能標準體系建設指南》、《新一代人工智能倫理規範》等多部政策文件,制定了「和平友好」、「公平公正」等人工智能健康發展的基本原則,以數據、 算法、系統、服務等領域為重點逐步建立起人工智能發展的指標體系框架,並提出倫理規 范作為人工智能各類活動的基本遵循。

2023 年 7 月,網信部等七部門發布《生成式人工智能服務管理暫行辦法》,明確了「發展 和安全並重、促進創新和依法治理相結合」的總體原則。相較於網信辦 4 月起草的《生成 式人工智能服務管理辦法(徵求意見稿)》,暫行辦法細化了各項管理細節,在適用對象、 監管分級、法律責任等方面提出具體規定,並圍繞算力、算法和數據三要素出台支持舉措。 暫行辦法與 2021 年 8 月頒布的《互聯網信息服務算法推薦管理規定》和 2022 年 11 月頒 布的《互聯網信息服務深度合成管理規定》形成我國 AI 監管的「三足鼎立」之勢,與《網 絡安全法》、《數據安全法》、《個人信息保護法》和《科學技術進步法》等上位法共同築起 目前我國人工智能監管的基本框架。

政策定調上,7 月 13 日網信辦等八部門共同頒發的《生成式人工智能服務管理暫行辦法》 與過去的《互聯網信息服務算法推薦管理規定》和《互聯網信息服務深度合成管理規定》 的監管思路一脈相承,均試圖在控制風險的同時支持 AI 產業的健康發展,避免一刀切; 在明確責任主體與相關權責範圍的同時,採取了風險分級的思路,對防範生成內容濫用、 知識產權與隱私保護等生成式人工智能應用的潛在風險進行了具體安排; 總體來看,我們認為該管理辦法對我國相關產業的健康發展有積極影響,對應對技術應用 領先監管而造成的一系列社會、倫理風險有充分的正面作用,其頒布實施有利於我國生成 式人工智能產業行穩致遠。從文本看,與 4 月的徵求意見稿相比監管的具體要求變化不大, 但從整體上對人工智能服務的監管原則角度,有了更加有利於人工智能行業發展的變化。



三、中美關係:競爭主導+有限合作

3.1 競爭主導,三大要素博弈加劇

算力:「卡脖子」問題仍待突破。大模型時代,算力是人工智能產業競爭的核心。目前我 國在承載算力的 AI 芯片等方面仍面臨較強的對外依賴,國產化存在空間的同時,美國不 斷收緊出口管制措施亦對我國算力供給產生較大擾動。拜登政府以來,美一方面延續實體 清單等制裁措施,另一方面藉助《CHIPS 法案》限制獲得聯邦資金的公司在中國的增產 計劃,還通過「芯片四方聯盟」機制將相關管制擴大化。考慮到半導體與人工智能產業的 全球分工屬性,算力芯片產業仍有賴於跨國協作與銷售,算力領域的競爭強化並非帕累托 改善。2023 年 7 月,美國三大芯片巨頭英特爾、高通和英偉達的高管會見了包括國務卿 布林肯在內的美國政府高官,呼籲政府評估其限制措施造成的潛在影響,避免進一步收緊 的半導體產品與製造設備出口管制對美國企業營收造成進一步負面影響;同時,美國半導 體行業協會也發表聲明,反對對華芯片銷售設置進一步限制。

算法:AI 人才成為稀缺資源。隨着複合型 AI 人才成為驅動 AI 算法優化和人產業發展的智 慧動能,「留住本土人才+吸引外來人才」成為保持人工智能算法核心競爭力的主要手段。 長期以來,美國憑藉其完善的教育體系和人才激勵機制吸引了大量中國留學生赴美深造和工作,據《紐約時報》統計,128 位在中國大學取得本科學位、在人工智能學術會議上發 表過論文的研究人員中,一半以上選擇在美國攻讀研究生學位並在美國工作,國際競爭下 AI 人才的流失對我國算法領域突破產生了不利影響。但是這種自發的學術交流渠道正在收 窄,美國政府通過縮短中國赴美留學生簽證期限,對中國學術人員及其研究嚴格審查並拒 簽為中國國防或安全部門直接或間接提供服務的相關人員,虛假指控中國籍或華裔專家 「竊取高科技商業機密」等政策工具對中國人才培養造成干擾,客觀上為中國赴美人才選 擇回國發展提供了驅動因素。根據《美國國家科學院院刊》最近發表的研究,2018 年啟 動的針對在美華裔學者強化審查的「中國計劃」直接造成從美國返回中國的華裔科學家顯 著增加。

數據:安全屬性上升至國家高度。數字經濟的深入發展使數據要素成為一種全新的生產要 素,全球範圍內數據資源的分配和控制成為各國競爭的焦點。一方面,美國以「國家安全」 為由嚴格限制個人數據向中國等國流動,以在全球數據資源競爭中搶占先機。2020 年 2 月頒布的《外國投資風險審查現代化法案》將外國對涉及敏感個人數據的美國企業投資納 入審查範圍;2021 年 11 月《2021 年敏感個人數據保護法》提案以「威脅國家安全」為 由要求進一步限制中國獲取美國個人數據,並要求數據處理商應向消費者公開數據是否提 供給中國。另一方面,美國還試圖實行強有力的國內政策,研發並投資有彈性的數字基礎 設施以加強美國在數據方面的控制和治理。

3.2 合作受限的同時,人工智能治理方向趨於一致

僅用競爭定義中美人工智能關係並不全面。長期以來,中美在人工智能領域的學術研究和 民間投資等方面建立了持久且穩定的合作關係。根據斯坦福大學發布的《2023 年人工智 能指數報告》,2010 年以來中美人工智能出版物的合作次數增長了 4 倍,居於跨國合作首 位;2021 年,「中-美」合作的數量是「中-英」合作的 2.5 倍。投資方面,美國知名技術 類智庫喬治城大學安全與新興技術中心(CSET)發布的報告顯示,2015-2021 年共有 167 名美國投資者參與了對中國人工智能公司的投資,交易數達 401 筆,約占同期全球 2299 筆中國人工智能企業投資交易的 17%;投資金額共計約 402 億美元,占同期中國人工智能企業融資總額的 37%,美國資本的大量湧入對我國人工智能產業發展起到了積極作用。

中美在人工智能共同治理存在對話空間。治理理念方面,中國注重發展「負責任的人工智 能」,而美歐則強調推進「值得信賴的人工智能」,雖然在具體的價值取向上有所差異,但 二者的總體方向一致,均強調發展安全、健康、可持續的人工智能技術。具體來看,在「軍 事領域負責任地使用人工智能」方面,中美已取得一定共識。2023 年 3 月的海牙峰會上, 包括中美在內的 60 多個國家共同簽署了一份「行動呼籲」,在國際法規定的範圍內「以不 損害國際安全、穩定和責任的方式」開發和使用軍事領域的人工智能。2023 年 7 月 18 日, 聯合國安理會第一次舉行關於人工智能對國際和平與安全的影響的會議,中美均表示要加 強人工智能治理的國際協調,未來兩國在算法歧視、數據隱私泄露和科技貧困等方面或有 較多合作機遇。

四、投資機會:關注算力、算法、數據三個方面

4.1 算力芯片:需求+政策共振

算力需求高斜率增長,AI 芯片持續受益。2012 年-2019 年,AI 算力需求以遠超摩爾定律 的速度倍增了 30 萬倍,大模型時代這一速度進一步躍遷至每 2 個月翻倍。隨着算法發展 和數據規模的不斷累積,越來越多的模型訓練需要巨量算力支撐。AI 算力需求的快速膨脹 要求更高性能 AI 芯片的配套支撐,根據中商情報網測算,2022 年我國算力產業市場規模 約為 628.11 億元,同比增 17.4%,2023 年將進一步增至 753.85 億元。未來,隨着 AI 商 業化應用場景逐漸擴展,在教育、醫療等領域的滲透率進一步提升,算力儲備的資源焦慮 成為驅動 AI 芯片發展的重要動力。

全球化退潮,「安全」概念成為邏輯基點。基於對經貿秩序、政治格局和技術創新與應用 的考察,我們判斷當前全球化處正於下行區間,強調安全重新成為各國共同的政策選擇。 國內 AI 芯片面臨嚴重的對外依賴,高通、英偉達等國際廠商幾乎壟斷了其核心供應。國 產化存在空間的同時,美國通過不斷收緊對華產業政策以保持本土競爭優勢,算力領域競 爭主導的中美關係難以短期改變。在此背景下,「安全」變量進入企業生產和政府決策的 函數,以「舉國體制+揭榜掛帥」的模式逐步擺脫我國對國外 AI 芯片的過度依賴,提升企 業自主創新能力,發展國產開源芯片意義重大。從「安全」概念的邏輯基點出發,國內 AI 芯片廠商面臨較大的商業機遇。 GPU 是當前主流的 AI 芯片,根據 IDC 測算,2022 年 GPU 占中國加速服務器市場份額達 89%,約 60 億美元規模。基於其兼具通用性和高性能計算的優勢,我們認為全功能 GPU 仍然是滿足未來 AI 大模型、多模態輸出需求的最佳解決方案,國產 GPU 廠商在算力需求 增長和本土產業發展的潮流中有望迎來新機。

4.2 算法人才:標的選擇的「試金石」

我國企業的 AI 人才缺口不容忽視。由於目前 AI 算法框架基本為開源產品,所以相較算力 方面的「卡脖子」問題,AI 人才儲備短板更易被忽視。縱觀 Tensor Flow(Google)、PyTorch (Meta)等搭建成熟的 AI 算法框架,其背後基本均以巨頭企業和高校支撐,建立在完備 的 AI 人才團隊上。相較於整個行業持續爆發的人才需求,國內 AI 人才尤其是算法人才缺 口較大。據脈脈發布的《人工智能頂尖人才數據圖鑑 2022》,在最難招崗位 TOP10 和最 熱招崗位 TOP10 中,均有 7 個算法崗位,其餘為工程崗位或非技術崗位。未來隨着人工 智能的深入發展,這一缺口可能繼續擴大。

人才積澱成為標的選擇的重要依據。在 AI 人才日益稀缺的背景下,我們認為良好的人才 儲備將成為算法領域企業制勝的必備條件,具體而言,建議考察以下維度: 1、標的屬地的人才支持政策。近年來,各地在完善學科體系建設、制定聯合培養機制、 優化人才服務等方面持續發力,北京還出台了算法領域的專門人才政策,在創業空間、算 力支持、算法交易、融資保障等方面給予算法人才施展才華的廣闊空間。 2、標的自身的人才激勵機制。良好的人才激勵機制是企業吸引人才、留住人才的根本, 據脈脈統計,算法工程師的月平均起薪超 30000 元,更高薪資待遇的公司更能滿足 AI 人 才的基本需求。另外,股權激勵等機制設計也有助於鎖定人才的長遠利益。 3、標的與科研院所的合作關係。根據斯坦福大學發布的《2023 年人工智能指數報告》, 我國的 AI 研究主要由高校等科研院所主導,企業主導的 AI 研究遠低於美國和歐盟,與高 校保持持續穩定的合作關係意味着企業更能在人才競爭中更能獲得先機。

4.3 數據標註:數據質量>數據規模

數據的質量比規模更為重要。依託龐大的移動互聯網和數量可觀的網民,我國數據資源豐 富,據 IDC 測算,2022-2027 年中國數據量規模將由 23.88ZB 增長至 76.6ZB,複合增速 達 26.3%。然而相較於美國,我國數據開源和市場流通較差、數據挖掘和治理能力滯後, 優質的中文數據集依然稀缺,大量非結構化數據無法被算法模型訓練所使用。據加利福尼 亞大學研究發現,全球機器學習和自然語言處理模型使用數據集的一半由 12 家 Top 機構 提供,其中美國占據 10 家,而中國僅有香港中文大學一家。此外,數據集的基尼係數呈 明顯上升趨勢,越來越多的數據集被少數機構或數據庫所掌控。

數據要素受到重視,規範化處理有望受益。2019 年以來,數據作為一種全新的生產要素 越來越受到國家重視。2022 年 12 月,中共中央、國務院出台「數據二十條」,在數據確 權、流通交易、收益分配、安全治理等方面架構起我國數據治理的基本框架。政策加碼下, 我們認為數據規模和質量的戲劇性「衝突」有望得到加速緩解,作為數據質量提升的必備 環節,數據標註等數據規範化處理相關企業有望受益。未來,更加精細化、場景化和專業 化的數據採集標註才能滿足日益增長的人工智能細分場景、專業垂直的賦能需求。

(本文僅供參考,不代表我們的任何投資建議。如需使用相關信息,請參閱報告原文。)-[報告出品方*作者:西部證券,雒雅梅/未來智庫]