ChatGPT會是大模型商業化的火炬嗎？

2023021213:29

ChatGPT走紅的速度，顯然超過了許多人的預期。

即使是在中文互聯網上，和ChatGPT有關的報道、討論，早已超過了其他科技概念，甚至萌生出了「ChatGPT概念股」的說法，不少與AI、大模型、NLP相關的中概股，短期內的漲幅「意外」達到了50%以上。

每一次有「科技大事件」上演時，都有人蠢蠢欲動，有人借勢起風，ChatGPT掀起的浪潮似乎也是如此。

可當我們在討論ChatGPT的時候，到底在討論什麼？顛覆式創新的技術洗禮，抑或是對人工智能前景的樂觀，還是在潛移默化中被有心人帶了風向。釐清這些問題的答案，遠比討論ChatGPT本身更有價值。

01. 一場自上而下的「出圈」

和2016年的AlphaGo一樣，ChatGPT的「火」也呈現出了自上而下的軌跡。

答案就隱藏在一篇篇10W+的爆款文章中。和ChatGPT相關的文章可謂盈千累萬，除了大批科技和財經類自媒體的分析與報道，就連旅遊博主們都開始以ChatGPT為主題，而且內容特別貼地氣：

大多是博主與ChatGPT的對話截圖，其中問題本身就相當有話題性，截取的問答同樣吸引眼球，再稍微關聯下AI取代人的宏大話題，以及可能存在的應用場景，短時間即可炮製出一篇大眾喜聞樂見的文章。

追熱點向來是自媒體們的「天職」，以爆紅的ChatGPT為題也無可厚非，問題恰恰出現在信息的不對稱上。

從2022年11月底上線運營，到2023年1月末的上億月活，ChatGPT用兩個月的時間就刷新了用戶增長的歷史記錄。只是在註冊體驗ChatGPT嘗鮮過程中，對中文互聯網的用戶相當不友好。

想要打開OpenAI的網址，前提是有「科學上網」的工具，而且ChatGPT並未對中國開放註冊，必須要用海外的手機用來接收驗證碼……可以說人為增加了重重壁壘。在這樣的註冊機制下，和ChatGPT「暢聊」的國內網民註定是「少數派」，大多數網民對ChatGPT的理解，是從別人口中「聽」來的。

正是在這樣的語境下，ChatGPT的「神奇能力」被不斷放大。箇中原因離不開人們對對話式機器人的特殊情愫。

無論是誕生於2014年的微軟小冰，以「智能助手」自居的Siri，還是主打語音交互的智能音箱，都曾吸引無數人的好奇心，在特定時間內引發了現象級的討論。畢竟早在上個世紀初，圖靈就提出「對話」是測試機器是否有人類智慧的有效場景。

沿循類似的邏輯，ChatGPT的「出圈」是註定的結果。背靠千億級大模型GPT-3，ChatGPT的自然語言理解能力遠超早期的微軟小冰和Siri，和用戶對話時不會根據一兩個關鍵詞機械地輸出結果，而是理解用戶的「語義」，輸出的準確性和關聯性不可同日而語，並在很大程度上刷新了人們的認知。

然而目前的ChatGPT還是大規模離線語料進行訓練的版本：無法將即時信息納入自己的回答中；經常給出一些看似合理但不正確的答案；對話中涵蓋的因果關係，仍缺乏很好的理解能力；缺少人類舉一反三的能力......並不能像朋友一樣自由對話。

陰謀論一些的話，在ChatGPT走紅的這些日子裡，並不缺少一些「炒作」的痕跡。比如讓人摸不着頭腦的「ChatGPT概念股」，至今還沒看到哪家中概股與OpenAI開展合作，所謂的概念股，多半是在蹭文本生成、信息抽取、知識抽取、機器問答等技術的熱度，屬於典型的「借事說事」。

而就當前的態勢來看，ChatGPT的熱度還將持續一段時間，但被刻意營造的期待值，就像是鼓吹起來的氣泡，再美麗也有被刺破的一天。與其去討論ChatGPT的短期效應，不如將視角放在對行業的長期影響上。

02. ChatGPT的偶然與必然

或許ChatGPT的「躥紅」有些偶然因素，可類似產品的出現卻是必然的結果。

可以佐證的是，在ChatGPT熱度空前的局面下，競品們正在加速追趕：谷歌CEO 桑達爾·皮查伊在2月7日凌晨宣布將推出一款名為 Bard 的實驗性對話 AI 服務，並將在幾周內向部分開發者開放。

幾乎和谷歌同一時間，百度官宣將推出類似ChatGPT的人工智能聊天機器人，項目名字被命名為「文心一言」，英文名「ERNIE Bot」，預計在3月份完成公測，或將直接接入百度搜索向公眾開放。

人工智能初創公司元語智能連忙推出了功能型對話產品 ChatYuan；阿里達摩院牽頭的類ChatGPT對話機器人被曝正處於內測階段；崑崙萬維宣布將與奇點智源合作年內發布中國版類 ChatGPT 代碼開源……還有更多產品在官宣的路上，不排除會出現畫虎不成反類犬的尷尬場面。

一種流行的解釋是：ChatGPT將取代搜索引擎。其中被引用最多的Gmail創建者之一Paul Buchheit的觀點：「像ChatGPT這種AI聊天機器人將摧毀谷歌，就像當年搜索引擎徹底幹掉黃頁電話簿一樣，時間上就是這一兩年。」內在的商業邏輯在於，一旦搜索引擎確定的信息檢索方式被顛覆，整個互聯網商業都將重新洗牌，沒有哪家互聯網巨頭想要錯過在新格局中占有一席之地的可能。

或許還有另外一種解釋，即ChatGPT的誕生是一種方向性的探索。OpenAI率先驗證了對話AI的可行性，然後谷歌、百度等快速跟進。之所以能夠在短時間內推出類似ChatGPT的產品，原因還要從大模型說起。

時間撥回到2017年，當時還在谷歌任職的Ashish Vaswani等人提出了Transformer架構，讓深度學習的參數達到了上億的規模；2018年穀歌推出了基於Transformer的雙向深層預訓練模型Bert，參數首次超過了3億規模；OpenAI同年提出了生成式預訓練Transformer模型GPT，進一步推動了大模型的發展。

但直到2020年，大模型才真正進入到大眾視野，誘因正是著名的GPT-3，擁有1750億個參數量，是傳統深度學習小模型的一萬倍以上，同時讓外界看到了「大力出奇蹟」的一幕：常見小模型需要對不同的任務使用不同模型分別訓練解決，而GPT-3先使用海量數據預訓練大模型，然後將模型參數初始化後再進行訓練，實現了作詩、聊天、答題、翻譯、寫代碼等一系列能力。

一場千億級大模型的軍備競賽由此拉開帷幕。

僅在2021年，國內的華為、智源、浪潮、阿里雲、百度等企業先後發布了自家的大模型產品，而後不斷從NLP延伸出了雙語、CV、跨模態等大模型。據OpenBMB開源社區的統計，目前全球超千億參數的大模型中，中國貢獻了1/3，美國貢獻了1/2，世界其他國家或組織貢獻了剩下的1/6。和歷史上的許多次「軍備競賽」一樣，耗費了大量真金白銀的大模型，最終也需要找到一個商業化出口。

有趣的地方在於，不管是GPT-3，還是ChatGPT，OpenAI兩次站在了新舊交替的臨界點上，第一次掀起了大模型熱，讓全球科技大廠們冒險一試，這一次能為大模型的商業化帶來生機嗎？

03. 大模型商業化的「火炬」

大模型的性能表現不可謂不性感，代價則是訓練大模型非常燒錢。

根據公開數據顯示，GPT-3訓練的硬件和電力成本高達1200萬美元；谷歌在訓練包含5400 億參數的 PaLM 時用了6144塊TPU……坊間由此出現了對盲目「煉大模型」的質疑，資本市場因為大模型的應用問題遲遲不肯下注，「多才多藝，身兼多職」的大模型們距離「生存危機」越來越近。

並非是大模型缺少商業化故事。按照大規模預訓練的思路，大模型+細分場景微調在某種程度上給出了人工智能在長尾場景落地的最優解，而且在小樣本訓練的情況下，大模型也有着比較好的提升。

大模型也不缺少落地的場景。AIGC在2022年就已經走紅，投資機構紅杉在2022年發布的一篇分析文章中特意提到，生成式AI有潛力產生數萬億美元的經濟價值，進一步增強了相關創業者的信心。

可在2023年以前，很少看到資本市場對大模型的關注，僅有智譜AI等為數不多的企業拿到了融資，與之形成鮮明對比的是，AIGC賽道里初創企業早已是資本寵兒。資本寧願在應用層的AIGC賽道試錯，也不願燒錢給大模型。

誠如熊彼特在《經濟發展理論》中的觀點：資本是創新的槓桿。倘若只是企業和研究院在花大價錢「煉」大模型，缺少資本產生的槓桿作用，大模型的價值和應用場景恐怕很難脫離「學術」二字。

ChatGPT的出圈就像是一把火炬，不但徹底吸引了外界的注意力，也可能為大模型的商業化照亮方向。

直接的例子就是微軟「反常行為」。先是100億美元投資OpenAI，而後宣布將ChatGPT融入旗下全線產品，比爾・蓋茨和納德拉頻頻為ChatGPT站台，再到ChatGPT版的必應和Edge瀏覽器，甚至裁撤工業元宇宙部門為ChatGPT讓路，儼然擺出了一副All in AI的新姿態。微軟的真實動機還不得而知，映射到外界眼中的卻是：微軟正在開啟AI的商用之戰，大模型迎來了商業化元年。

OpenAI也在不斷釋放好消息：2月1日宣布推出付費訂閱版ChatGPT Plus，每個月向用戶收取20美元的費用；同時OpenAI預計2023年的收入將達到2億美元，2024年收入有望超過10億美元。

其實早在2020年的時候，OpenAI就已經開始為商業化謀局，GPT-3不再完全開源代碼，但提供了商用API，允許開發者調用大模型的部分能力，並逐步為Dall·E2、Whisper等大模型開放了API接口。客戶調用OpenAI的API，以獲取圖像、語言、代碼生成等能力，進而趕上AIGC的順風車，OpenAI從中收取接口費，初步形成了模型研發、應用開發到消費的完整產業鏈。

故事講到這裡，似乎讓人看到了大模型的可觀前景：當國內大大小小的互聯網企業爭相推出各種版本的ChatGPT時，勢必會將注意力盯向提供底層能力的大模型，為國內的大模型市場注入一股活水。

再樂觀一些的話，即便ChatGPT的潮水會褪去，只要在不斷地試錯中摸索出大模型的商業化路徑，資本的注意力終將會聚集到底層技術上，並將注意力轉變為源源不斷的投資，賦予大模型可持續的驅動力量。

04. 寫在最後

現實的殘酷在於，新物種崛起的時候，會習慣性吹起一層層泡沫，特別是在過去幾年中，泡沫被戳破的時間周期越來越短。

2021年初爆火的Clubhouse，故事在一個多季度後就宣告「破產」；2022年初的元宇宙，下半年就被AIGC搶去了風頭；ChatGPT引起的新風口，會是一個例外嗎？就情感上而言，我們希望ChatGPT帶來的是一場熊熊烈火，引燃人工智能的產業革命。

可惜當前的所有設想，都還建立在理想的假設上，現實中仍存在太多的不確定性，還需要跨越一座又一座山丘。-(文:Alter/來源:鈦媒體)

我要留言

ChatGPT會是大模型商業化的火炬嗎？

大廠傷心人，集體去造車

業務流程將因生成式AI變革，ChatGPT引領的AIGC正在改變組織運營

大廠傷心人，集體去造車

業務流程將因生成式AI變革，ChatGPT引領的AIGC正在改變組織運營