狂飆的ChatGPT,帶來的行業變革
過去的一周,朋友圈裡的能人們又有了新工作,ChatGPT代註冊。
2022年11月,OpenAI推出ChatGPT聊天機器人,以對話的形式與用戶進行連續性的交互,與此前常見的Siri、小藝等手機交互系統不同,ChatGPT不僅可以回答問題,還能完成代碼修改、內容創作等。
在此基礎上,ChatGPT還具備糾正錯誤、拒絕不正當要求的能力,這意味着ChatGPT的人工智能程度,遠高於此前大火的AIGC。雖然目前已經有團隊繞開ChatGPT的安全限制,但自古至今哪個技術的發展不是一波三折?
2月10日,國內科技圈頭部企業華為公開表示,公司早在2020年就布局了相關領域,2021年發布的鵬城盤古大模型就是類ChatGPT產品,也是業界首個千億級生成和理解中文NLP大模型。除了華為之外,京東本月已經推出產業版競品「chatJD」,百度也將於3月推出類ChatGPT產品。
而那些還沒入局的企業,正在迫不及待想要湧入該賽道。美團聯合創始人王慧文在社交平台宣布,將要帶着5000萬美元組隊切入該賽道,而且根本不在意崗位、薪資和title。
由此可見,ChatGPT已經在科技圈掀起新浪潮,可是它和之前的aigc產品到底有什麼不同?是否又是曇花一現,大眾過了新鮮勁兒後是否會將其拋之腦後?
01 ChatGPT和AIGC有什麼不同?
雖然ChatGPT和AI作畫軟件等同屬於AIGC領域,但是ChatGPT除了繪圖外,還可用於文本、視頻等內容的「原創」,且比此前的AIGC產品更擬人化。
而且ChatGPT還可用於3D交互以及包括開啟科學新發現、創造新價值和意義,因此Gartner將生成性AI列為2022年5大影響力技術之一,MIT科技評論也將AI合成數據列為2022年十大突破性技術之一。
ChatGPT之所以能顯著區分於其他競品,主要是因為其引入了RLHF(Reinforcement Learning from Human Feedback,人類反饋強化學習)的訓練方式,從而在訓練中增強了人類對模型輸出結果的調節,促使模型輸出結果更具備理解性。
得益於其更強的互動性,ChatGPT已經達成1億月活用戶里程碑,並開始向用戶收費。其競品如科大訊飛等商業化進程已經被遠遠甩開。而且科大訊飛付費使用的軟件服務中,還停留在語音文件和文字的互轉領域,略帶交互功能的付費產品則是採取軟硬件打包出售的形式。
而在語義交互在這個領域內,國內企業科大訊飛其實更具優勢,首先是在知識推理閱讀理解比賽 OpenBookQA、QASC 中奪冠,從其在比賽中的表現來看,科大訊飛相關訓練模型已經超出人類平均水平,甚至在邏輯推理閱讀理解比賽ReClor中刷新全球最好成績。
只可惜科大訊飛沒有基於此率先推出類似ChatGPT的產品。ChatGPT的出現,其實意味着人工智能算法的進一步升級。採用Transformer模型的ChatGPT,首先是突破了RNN 模型不能並行計算的限制;其次關聯所需的操作次數不隨距離增長。得益於新模型的應用,ChatGPT的解釋力度更強。
根據CDSN數據,Transformer的綜合特徵提取能力、遠距離特徵捕獲能力、語義特徵提取能力,全部明顯增強。另據機器之心消息,自從ChatGPT上線後,全新的AI模型因為能回答問題、編寫代碼、自行創作,被認為是下一代搜索引擎的雛形,但目前遠未達到替代傳統搜索引擎的地步。
但是伴隨硬件的提升以及算法進一步完善,傳統搜索引擎的日子確實不好過了。
02 ChatGPT背後是行業變革
ChatGPT席捲社交圈的背後,是其正在逐漸推動科技業加速變革。
具體來看,Meta今年的資本開支將下調40億美元,減少部分數據中心投資,轉而支持AI等相關產品。微軟、谷歌等也將在調整資本開支的前提下進一步加速對於AI相關的投資。
其中微軟的操作最引人矚目,顯示宣布在3月31日前裁員1萬人,中國區裁員比例不高於5%,就在其宣布裁員的前一天,微軟公司CEO、董事長納德拉在達沃斯經濟論壇上表示:新冠暴發期間,科技行業迅速發展,但目前處於需求正常化的階段,得用更少的錢做更多的事,即用自己的技術提高生產率。
對於規模企業而言,提高生產率最簡單粗暴的手段自然就是裁員。就目前來看,ChatGPT可以有效提升內容創作者的工作效率,反映在二級市場上,微軟宣布裁員當天,美股盤前上漲1.5%。
其實作為科技業老兵,微軟早就着手用機器代替人工,早在2019年和2021年,微軟就兩次投資OpenAI,近期又有消息稱,微軟計劃再向OpenAI注資100億美元。有分析指出,這次萬人裁員是日前風靡科技界的ChatGPT帶來的直接結果。
ChatGPT持續熱度下,AI投資已經成為北美各大雲廠商下階段投資主力,海外雲巨頭已經開始加速布局。根據德邦研究所統計,谷歌、微軟等傳統科技企業,均完成了AIGC領域的布局。
AIGC 基礎設施層面,OpenAI、Stability.ai 等已經牢牢占據頭部位置,他們主要負責預訓練模型,但盈利模式卻截然相反。
Stability.ai目前的估值超過10 億美元,公司目前將其基礎版的產品完全對外開源,其盈利模式主要基於面對客戶開發和銷售專業版和定製版。OpenAI 的盈利模式基於公司對其受控 api 的外部調用來進行收費操作
中間層由於需要滿足垂直化、個性化、場景化的應用特點,所以參與企業較多,所有涵蓋模型即服務(Model-as-aService,MaaS)的企業均屬於AIGC行業中間層;應用層面,由於下游消費者的的需求占據重要地位,需求與AIGC模型的無縫銜接助推產業應用發展。
行業下游以內容創作者為主,他們可以憑藉前兩層預訓練好的模型,以及C端消費級顯卡的算力來挖掘出更為豐富的應用場景和內容。目前接近C端用戶的工具日漸豐富,包括網頁、移動端小程序、基於AIGC的自主畫圖服務等。
那麼誰能限制正在狂飆的ChatGPT?這個答案其實顯而易見,那就是算力。
除了內容創作者依賴消費級顯卡完成工作外,負責模型預訓練的上游企業,如OpenAI等也需要穩定高效的算力資源。
2018年OpenAI推出GPT-1模型,參數量達到1億級別,2019、2020年OpenAI又陸續迭代出GPT-2、GPT-3模型,參數量分別為15億、1750億。隨着模型參數量提升,算力需求隨之加大。
國內企業想要在aigc方面獲得長足發展,首先就是解決算力支撐問題。由於種種不可抗力,國內人工智能領域先後經歷多次海外大廠限制芯片供應的問題,國內顯卡廠商中,景嘉微正在穩定推動顯卡產品迭代,其2022年5月發布的JM9系列第二款GPU芯片,已經能滿足地理信息系統、媒體處理、CAD輔助設計、遊戲、虛擬化等高性能顯示需求和人工智能計算需求,但並不足以實現國產替代。
目前AIGC發展的天花板,仍舊掌握在英偉達、AMD等海外芯片大廠手中,但AIGC由於尚處於高速發展期,英偉達、AMD現有產品足以應對AIGC所需。在算力加持下,AIGC帶來的衝擊已經向科技業外的各行各業蔓延。
03 ChatGPT雖然有風險,但也被同行羨慕
AIGC作為內容創作工具,發展的越先進,對人們生活工作的正反饋就越強,但是和「P2P」一樣,作為新技術,總會被別有居心的利用。
關於ChatGPT的報道中,讓人印象最深刻的是多家大學明確禁止學生使用ChatGPT寫論文,為應對ChatGPT在文字工作中的「超能力」,大學教授們正在重新設計他們的課程評估體系,比如增加更多的口試、小組工作等。
只是這種「掩耳盜鈴」式的限制手段,根本不可能避免有人使用ChatGPT完成學術論文,國內某法學教師預計,ChatGPT很有可能引發學術亂象問題。
一個人工智能軟件,引發學術亂象,你敢想象嗎?
實際上,在ChatGPT之前,人工智能軟件早就滲透入論文創作、出版的各個環節,比如PaperPal和Writefull早就被用於論文寫作,類似Wiley'sRex之類的軟件還能自動從論文中提取數據,其他諸如查重、排版等領域,也都不乏人工智能的身影。但都沒有引發學術界的恐慌,更不會明確要求學生禁止使用。
因為ChatGPT出現前的各類軟件,主要為創作者提供輔助作用,而ChatGPT可以擔負更重要任務,甚至可以替代作者完成整篇文章的寫作。長此以往下去,也許在未來某一天,一台經過調校的機器,可以成為一名合格的執行者,人只需要提想法,類似ChatGPT的軟件就能直接產出論文,甚至連論文格式都不用調整。
這種背景下,圖靈獎得主、Meta的首席AI科學家Yann LeCun公開吐酸水,ChatGPT胡說八道,你們卻不管不顧,我們的Galactica上線三天,就被罵下架了。
不得不說,作為深度學習三巨頭之一的Yann LeCun,表達的專業觀點不會出原則性問題,比如「大型語言模型並沒有物理直覺,它們是基於文本訓練的……它們的回答,也可能是完全錯誤的。」「依靠自動回歸和響應預測下一個單詞的LLM是條歪路,因為它們既不能計劃也不能推理。」
但是落實到具體應用上,都可能出錯的前提下,誰的產品錯誤率更低誰就能在市場上存活,顯然月活突破一個億的ChatGPT已經實現了這個目標,即便是三巨頭之一的Yann LeCun,也只有羨慕的份兒。羨慕到自己的產品在ChatGPT面前一無是處,只能下線,自己的工作成果似乎瞬間歸零。
或許給ChatGPT一點時間,也許它真的能給你一個驚喜,或者,接替你的工作,你升職加薪或者就此失業。-(鈦媒體/文:貝克街探案官*作者:包可萌)