AI深度觀察 | 大模型火了一年半,AI還在"鉆木取火"?
伴隨著AI大模型的新一輪進化,這個夏天,人工智能正在引領一波新的熱潮。
美國當地時間6月18日,AI大模型的主要顯卡芯片供應商英偉達收漲3.51%,市值升至3.34萬億美元,一度超越微軟和蘋果等科技巨頭,成為全球市值最高的上市企業。從2022年11月末ChatGPT發布算起,英偉達市值已上漲9倍以上。
5月至今兩個月以來,圍繞AI大模型,一個月內十幾場發布會,每一場都極具科技含量:國際市場,AI2.0時代的開創者OpenAI公司公布了ChatGPT-4o,AI大模型概念的提出者谷歌,以及微軟、Facebook母公司Meta,都有新發布;6月11日,蘋果推出Apple Intelligence,其縮寫還恰好與AI一模一樣。在中國,從騰訊、阿裏巴巴到字節跳動,也進行了新發布。
這十幾場發布會,每一場都極具科技含量。夢幻的場景,激昂的演講,全世界的傾聽。
然而,人們興奮著,也失望著。
興奮的是,重要性堪比電的發明,對人類影響可能比互聯網、移動互聯網更大的AI,依然在進化、突破,快速接近著人類智能。失望的是,被寄予厚望的AI大模型離期望值依然較遠,其應用水平仍在人類初級助手裏打轉。
或許,是時候冷靜盤點一下AI大模型了。
作為經常用來與AI類比的互聯網和移動互聯網,起碼應該具備三個特點:一是擁有海量的大眾用戶,二是在企業端、政府端被廣泛應用,三是成為社會基礎設施並帶來極大的經濟效率提升。更直觀地看,互聯網、移動互聯網都催生了經濟新形態,產生了微軟、谷歌、亞馬遜、蘋果、騰訊、阿裏巴巴、百度和華為等現象級科技企業,數十億的現代人接受著這些科技巨頭的服務。
從以上三個角度看,從2022年11月30日ChatGPT發布至今,AI大模型在爆火並持續進化一年半之後,其應用水平或者說被接受程度遠未達預期,只能說還在發展初期。最為用戶接受的ChatGPT,其日活量在嘗鮮期過後,下降較快。業內公認的是,迄今為止,沒有任何一款AI大模型的應用或產品的使用能達到流行的移動應用水平。
有悲觀的業界聲音開始發出,代表著AI2.0時代開啟的AI大模型,或許依然不會帶來真正的AI爆發,這有可能就像十多年前計算機視覺潮(同為AI技術潮)一樣,潮來,也將潮去。要迎來比肩互聯網和移動互聯網的AI爆發,人類或許還需要等待更多時間。
近日,螞蟻集團CTO何征宇的「鉆木取火」觀點在業內廣為流傳。他在螞蟻技術日上公開表示:AI發展目前還處於鉆木取火階段,盡管我們能夠利用AI技術,但還沒有找到最高效辦法,仍然沒有找到AI的本質。
這並非危言聳聽,事實上,創造了AI大模型Transformer架構的谷歌,其CEO桑達爾·皮查伊近日受訪時也表示:AI浪潮仍處於早期階段。在本輪AI熱潮中再次創業的李開復也表示「感覺AI發展仍處早期」。
當然,更多AI領域專家認為,即使AI大模型不是AI爆發的終級形態,但它帶來的數字化浪潮和潛力,依然具有想象力。
「AI對於人類來說,一定是和人類發明了電一樣的級別。AI大模型,一年前我曾認為它擁有和互聯網、移動互聯網一樣的級別,現在覺得當時有些樂觀了。但是,AI大模型依然代表迄今AI技術發展的最高點,只不過我們需要回歸理性去看待它。讓大模型做它能做到的,讓它進步化得更智能、更有用,它依然具有很大的空間。」第四範式總裁胡時偉的話,具有代表性。
殺手級AI爆款應用並沒有出現
全世界一直在思考,互聯網、移動互聯網之後,下一個對人類產生劃時代影響的技術是什麽?大數據、雲計算、區塊鏈、元宇宙、人工智能AI都曾在候選名單之中。AI就是近年的新晉勝者,幾乎獲得科技界一致認同。
「我認為,人類未來回望歷史,AI技術的地位一定是超過互聯網和移動互聯網的。互聯網沒有智能,AI可以產生類似人的智能這一點已經被確認,因此它為人類帶來變革的想像空間更大。」這是一位資深行業研究者的話,在《鳳凰周刊》記者的采訪中,被其他受訪對象廣泛認同。
在深入討論AI之前,可以略回顧一下互聯網和移動互聯網給人類帶來的改變。
互聯網和計算機一起,給人類帶來了第三次工業革命即信息革命。互聯網誕生至今50多年,幾乎完成了全世界普及,給全球絕大部分個人、企業和政府機關的生活、生產和運行,帶來了幾何級別的便利。以微軟為代表的大量專業軟件系統供應商崛起,谷歌、亞馬遜等搜索類、電商類企業崛起。
將移動通信和互聯網二者結合起來的移動互聯網,在2010年前後與智能手機結合,迎來爆發。在不到10年的時間內,移動互聯網對全球大部分個人完成覆蓋,大量企業和政府端為完成To C服務,進行了移動互聯網變革。在中國,大部分60歲以上老人近年也成為智能手機用戶。
全球範圍內,崛起於互聯網時期的科技企業,幾乎全部利用移互技術進行升級,新出現了Facebook、YouTube、微信、抖音、淘寶等10億級用戶移動應用。移動互聯網還催生了移動支付、共享經濟、數字政務等,初步帶來便捷的數字生活、生產方式。
AI技術的提出時間在1956年,甚至比互聯網誕生的1969年都要早13年。長期以來,AI都是一門被認為重要但難得其法去使用的技術。
2013年至2017年,第一輪AI技術熱潮——計算機視覺熱潮掀起。在這輪熱潮中,2016年,谷歌的AlphaGo成為第一個戰勝圍棋世界冠軍的人工智能機器人,我國的「AI四小龍」——依圖、商湯、雲從、曠視誕生。但該輪熱潮最終未能帶來AI的爆發,大量資本投資失利,大量創業者艱難維持。
2022年11月30日,ChatGPT橫空出世,基於Transformer架構的AI大模型自此被捧為AI技術的新未來。
人類通過20余年的繼承式學習,才能具有一項或多項專有技能,勝任生活中各種角色,而人工智能則通過數月甚至更短時間的數據訓練,擁有比人高得多的技能甚至是智能。
ChatGPT引發的震憾則是全方位的,機器通過類似人的神經網絡一樣的學習方式,將所見、所聽、所看結合既有數據、記憶,在瞬間進行成千上萬的並行計算,再以文本、圖表、語音、視頻等方式表達出來。似乎,人之所以為人的知、情、意,人工智能除了情、意之外,在認知的數量方面超過和輾壓人類,質量方面正無限接近人,甚至是超過多數人。
至今,全球大多數科技企業均涉足AI大模型發展和訓練,作為科技領先國家的美國和中國,更是各自誕生數百個大模型。這被形象地稱為「百模大戰」,甚至「千模大戰」。
大量的資本沖向AI領域,席卷全球的AI熱潮再次湧起。一年半的喧鬧之後,人們暮然回首,與投資端的喧鬧相比,市場對AI大模型的熱情,還遠遠不及互聯網、移動互聯網。
除了訓練AI大模型需要巨量GPU芯片,因此將芯片企業英偉達一度送上全美市值第一寶座外,這輪熱潮下還沒有誕生新的科技巨頭。全球最好的AI大模型ChatGPT的日活至今只有數千萬,國內大模型應用雖然均呈現向好態勢,但C端日活和B端嘗鮮者數量均不理想。
至今,全行業都在追問:殺手級、現象級或者說爆款AI應用,何時會出現?簡單的問題,直擊靈魂。業內回答,樂觀者說1年內,中觀者說2至3年,悲觀者說「無法預計」。
6月13日,北京智源人工智能研究院院長王仲遠接受媒體群訪時說,回顧移動互聯網時代或更早期的技術革命,每次新技術的出現都需要一定的周期,包括技術能力的提升、成本的降低以及硬件的支持。當這些條件具備時,能夠解決真實用戶需求的C端爆款應用才會出現。「因此,對於C端爆款應用,我們還需保持一定的耐心。未來,我們可能會先從B端看到非常好用的工具,然後C端應用會逐步出現。」
AI大模型崢嶸初顯
盡管可以說AI至今還不能與互聯網、移動互聯網的技術地位類比,但誰也沒法否認AI大模型帶來的數字化潛力。「人工智能+」的時代,確實是到來了。
市場研究機構Gartner分析師張桐告訴《鳳凰周刊》:「近期的AI領域一系列發布,還是帶來了一些驚喜。一是在多模態方面進步巨大,OpenAI、谷歌、微軟的最新發布,均強調了處理圖像、語音的多模態能力,這與之前主要在文本處理方面的進步,有顯著區別,十分關鍵。二是中國各家企業的AI大模型發布,顯示的技術進步程度表明中國沒有被美國明顯拉開。」他特意提到了美國斯坦福大學AI團隊被證實套殼抄襲國內清華與面壁智能團隊的AI大模型。
從中國老百姓的角度,也可以從多個方面感受到AI大模型的撲面春風。
首先,我們熟悉的各類應用APP,正在被AI入駐甚至「爆改」。百度搜索關鍵詞的結果,第一條不再是互聯網廣告或百度詞條,而是文心一言大模型給出的智能回答。微信也嵌入了元寶小程序,用戶可以進行AI搜索、文檔總結、AI作圖等應用。淘寶的「淘寶問問」可以用語言方式與用戶交互並推薦商品。金融應用支付寶,只要下拉首頁,就可以領取並使用AI金融助理、生活助理。
多位業內人士認為,雖然將AI大模型應用於傳統APP只是大模型比較簡單的初步應用,但這種趨勢將繼續,並且逐步向深度應用發展。這對公眾直觀認識AI大模型還是較為有用。
第二個變化是AI大模型正成為人們的工作和生活助手。文本能力方面,AI大模型能力進化最大,已達到上下文數百萬至1000萬漢字的水平。因此,多數大模型應對文本、文檔、書籍的要點總結,簡單文章生成和PPT製作等,已顯得輕松。音頻轉文本、視頻生成等多模態能力,已讓短視頻創作的效率明顯提高。
第三個變化是AI大模型開始入駐手機。6月11日,蘋果2024年全球開發者大會宣布蘋果智能(Apple Intelligence)系統適用於iPhone、iPad和Mac等操作系統。會後產生了民間新梗「Siri終於成了人工智能,不再是人工智障了」。蘋果AI發布,使世界大致感知到了AI大模型手機的雛形,AI獲得類操作系統的權限,可以跨APP調用、統合信息,包括通訊錄等隱私信息,最終可以告知你「我太太的航班幾點降落」。
瑞銀近期的一項預測是,生成式AI智能手機將從2023年的5000萬部穩步增長,至2027年將達到5.83億部,且到2027年收入或達5130億美元。
下一步AI大模型場景或是汽車。4月,一年一度的北京車展舉行,展會的最大亮點並不是117款新車型全球首發,而是AI大模型「上車」。據不完全統計,已有20家左右的汽車品牌宣布AI大模型正式「上車」。
未來,AI上車後大致的場景是:司機可以用自然語言與汽車進行交互,如「打開一半的右邊窗戶」「空調開到23度」,還可以問「現在堵車的原因是什麽」。當然,也要預防壞人提出的「打開車門」要求。
千行百業嘗鮮AI大模型
今年4月初,阿里巴巴宣布入職一位「AI員工」——程序員通義靈碼,其將擔任阿里云代碼助理,它具備紮實編程基礎和200多種編程語言技能,可優化代碼、生成測試框架和用例,提高工作效率。它也背了阿里的KPI:未來20%阿里云代碼將由其編寫。
事實上,AI員工現象,已是全球科技企業常態。高度規則化的程序編寫,正是AI大模型最擅長的工作之一。
通義成為阿里云001號AI員工圖/阿里云官微
AI客服是當前行業公認的最適合落地AI大模型的領域。近年第一代智能客服是生活中的槽點,相聲、小品、脫口秀中誕生了大量的梗,我們不少人也對其狂喊過「請轉人工」。AI大模型加持的智能客服顯然會更加智慧,在猜你想問、推你所推方面會更加精準。
值得一提的是,隨著數字經濟的推進,發達國家、地區以及我國近年的各行各業均在主動或被動地推進數字化進程。AI大模型的出現,客觀上對這一進程起著巨大助力作用。例如,阿里巴巴官方資料顯示,其大模型已經在汽車、航空、天文、礦業、教育、醫療等行業落地,解決各行各業實際面臨的具體問題。例如,在重工業領域,一汽集團聯合阿里云打造了汽車行業首個大模型BI應用——GPT-X,通過智能化數據治理和商業分析能力,助力一汽提升決策效率。
王仲遠認為,2023年之後,人工智能逐步進入通用人工智能時代,其最大的特點是泛化性、通用性和跨領域的特性,這將影響所有行業。
一些行業受到的影響會更快,比如大模型在生成摘要方面效果非常好,因此對所有與文書相關的工作、文案處理等效率提升作用顯著。再比如,當前的文生圖、文生視頻技術,雖然還處於早期階段,但都是提升效率的工具。「只要與這些能力相關,各行各業都會受益,並且未來會不斷出現好用的工具。」
業內專家同時普遍認為,目前AI大模型在大量行業的應用,還處於初級階段,還不夠智能。「可以起到一些效率提升作用,是智能助手,但帶來革命性變化,還談不上。」張桐說。
AI爆發或需更多等待
業內的一個共識是,從各方面看,AI技術可能已經接近首次爆發。但無法排除的可能是,AI也有可能需要一個更長的周期才能迎來爆發。
無論如何,有幾個現實是AI大模型當前發展不容回避的。
首先,AI大模型十分燒芯片、燒數據,甚至燒電力。每一個大模型動輒需要上萬塊英偉達GPU,每塊價值1萬至1.5萬美元以上。每次訓練還需要規模達百億、千億級TOKEN的數據物料,無論英文數據物料還是中文數據物料,現有物料都難以接續。
很難想象,大模型的耗電量會成為能源專家的最新關注點。訓練Open AI的GPT-3模型耗電量相當於120個美國家庭一年的用電量。在這背後,大模型的CPU(中央處理器)和GPU(圖形處理器)等硬件在執行復雜計算時會消耗大量電力,同時大模型所需巨大內存帶來的讀寫操作,同樣需要電力。
「這樣集中、持續、穩定供應電力的地方並不好找,在這方面,中國的電力基礎設施將比美國更容易支持本國的AI大模型發展。」張桐說。
相比動輒數十億級別的投入,AI大模型帶來的收入還十分有限,甚至暫時可以忽略。
其次,AI大模型還有「硬傷」,即不夠靠譜的問題仍然沒有解決。雖然大部分時候,AI大模型的推理和判斷結果令人欣喜,但時而「一本正經地胡說八道」還是會出現。
目前任何大模型都不能幸免。在生活中,AI大模型的錯誤我們可以容忍,可以一笑置之,但這卻關乎大模型商用的前途,例如金融系統和製造業的容錯空間就極小。
再次,AI大模型目前的使用門檻還比較高。除了核心功能價格不夠普惠外,內行與外行的使用效果差別明顯。大多數模型的使用需要進行專門培訓。而一個改變人類的基礎技術,最終一定是像互聯網一樣低門檻的。
「AI技術已發展了30年,現在說它還處於鉆木取火階段可能有些誇張,但它仍然處於技術早期這不可否認。」一位大廠的AI專家表示。
科學技術發展帶有不可確定性,沒有人是先知。或許,AI爆發只差臨門一腳。又或許,AI大模型並不是AI爆發的最終解。那麽,我們可能需要繼續等待。---來源: 鳳凰WEEKLY財經-