OpenAI選擇“閉源”,爲何反而火了“開源”?
臨近年末,開源領域“火力全開”:華爲以超過120個上遊軟件和多個主流開源項目的貢獻值,在多個主流開源項目中排名第一;上海開發的“書生·浦語靈筆”圖文混合大模型開源不到兩個月,模型代碼被各國開發者下載1.7萬次,在線展示體驗模塊試用超17萬次。
2021年,國家“十四五”規劃明確提出支持數字技術開源社區等創新聯合體發展。憑借開放、協作、共享的特點,開源已成爲全球軟件開發和産業創新發展的主導協作模式,通過開源開放模式加速信息産業生態共建已成爲業界共識。昨天在滬舉行的2023開源産業生態大會上,專家解讀了開源火爆的原因,也分析了開源模式如何爲數字經濟發展提供強大助力。
數字經濟催生新型生産方式
“從某種角度來看,‘開源’是違反傳統經濟學基本原理的。”中國通信院雲計算與大數據研究所所長何寶宏說,經濟學是關于物理世界的,底層邏輯是物質和能量;而數字經濟是關于數字世界的,底層邏輯是數據和算力。
這兩者有何不同?上海對外經貿大學人工智能與變革管理研究院副院長、上海開源信息技術協會秘書長張國鋒教授是用喝水來類比:物理世界的資源是稀缺的,一杯水一個人多喝一口,另一個人就少喝一口;而在數字世界,一張水的圖片可以同時被無數人擁有,且擁有的人越多,其價值反而越大。
數字資産不僅要解決稀缺性,還要創造稀缺性,因此其運行邏輯和傳統經濟系統不同。比如。在傳統經濟社會中,人們會將各色物品換成一般等價物,也就是貨幣;但在數字世界中,人們需要給數字産品打上不同編號,如NFT(非同質化代幣),才能賦予其傳統意義上的“價值”。
數字産品的可共享屬性,造就了開源這種以開放、平等、協作、共享爲主要特征的新型生産方式,也成就了互聯網的繁榮。從早期的操作系統Linux,到近年來的手機終端安卓、雲計算領域的Open Stack,以及AI深度學習領域的TensorFlow、PyTorch等,這些借助開源互聯網而興起的開源軟件,如今又成了數字經濟的基石。
“數字轉型的終點是數字原生,在數字原生世界中,開源更會‘如魚得水’。”何寶宏說。
大模型熱讓更多人選擇開源
開源(軟件)許可協議起源于上世紀70年代,它放棄了一些傳統的版權許可限制,在一定條件下允許其他人使用、修改和分發自己的源代碼級作品,以促進共享與合作。
不過時至今日,基于版權的“古典”開源定義正受到雲計算、大數據、大模型以及生成式人工智能(AIGC)的挑戰。目前,AIGC涉及的版權和開放許可還未形成廣泛共識。今年3月,美國版權局發布的《AI版權認定聲明及登記指引》提出,純AIGC作品不受版權法保護。
在今年爆火的大模型領域,OpenAI公司開發的GPT-3.5、GPT-4,以及百度文心大模型,都選擇了閉源。這引發了專家的擔憂。比如,閉源大模型可能會加大數字鴻溝,造成大公司的數字壟斷,並由此侵占普通人的數字空間話語權。
“以ChatGPT爲代表的生成式大語言模型的問世,反而讓更多人選擇開源。”在何寶宏看來,這也是近段時間開源持續火熱的原因,大模型産業需要建立在開源之上。
與OpenAI“打得火熱”的微軟最近又與Hugging Face達成深度技術合作。Hugging Face是一家開源模型庫公司,憑借Transformers模型庫和活躍的人工智能社區得到關注,被認爲是開源替代ChatGPT中最具實力的一員。目前,Hugging Face上開源的人工智能模型超過28萬個,涉及66個開源協議。
自2008年開始,華爲就積極參與開源、融入開源、貢獻開源。華爲終端BG軟件部總裁龔體表示,OpenHarmony在共建夥伴的持續貢獻下日趨繁榮,已經成爲下一代智能終端操作系統的根社區和萬物互聯的數字底座。截至目前,OpenHarmony已有51家共建單位,超過6200位共建者,累計代碼量1億多行,440多款軟硬件産品通過兼容性測評,並在教育、金融、交通、航天、工業等多個行業落地,真正實現“上天入地”,賦能千行百業。
[作者:沈湫莎*圖:受訪者提供* 編輯:沈湫莎 *責任編輯:任荃/文匯報]