審視AI Agent:追捧、落地,和2024年的To B破局點
今年4月份,斯坦福和谷歌的研究者共同創建了一個“西部世界小鎮(Westworldsimulation)”,在這個小鎮裏,25個智能體可執行類似人類的日常行爲,比如起床後做早餐然後去上班,藝術家作畫,作家寫作。
這些就是如今人們共同談論的“AI Agent實驗”。而在國內的今年下半年,大模型市場的玩家們,似乎正齊刷刷地轉向AI Agent——這個清晰可見的AGI終局産品。
一組數據顯示,截止11月中旬,AI Agent賽道發生融資事件13起,總融資金額約735億人民幣,公司融資均值爲56.54億人民幣。
而在國外,這一領域亦是火爆。“至少有100個項目正致力于將AI代理商業化,近10萬名開發人員正在構建自主Agent。”外媒MattSchlicht曾表示。
* AI Agent爲何如此火爆?
關于AI Agent的想象力,一個高贊回答是:“大語言模型只能編個貪吃蛇,而AI Agent可以整出一個王者榮耀。”
成熟的AI Agent可以使軟件生産大幅降低成本。未來Coding工作流中會很多Agent臨時寫成的軟件和測試方案,不追求長期的可複用性,可以隨用隨抛。目前一家軟件行業巨頭動辄上萬甚至十萬人,有了AI Agent之後研發、交付需要耗費的人力和資金將大幅降低。而且使得軟件可以靈活地解決更多長尾需求。
此外,AI Agent或將爲LLM搭建一套框架來進行深度思考和分析,從而做出更複雜和可靠的決策。
總之,就像微軟創始人比爾·蓋茨所說的那樣:“誰能主宰個人助理Agent,那才是大事。因爲你將永遠不去搜索網站,不去生産力網站,不去亞馬遜。”
值得注意的是,在這種巨大的技術變革下,目前我們仍沒有切身體會到AI Agent所帶來的紅利和變化。很明顯,AI Agent的發展仍面臨一些難題。
一些值得探討的問題是,國內外AI Agent的發展現狀如何?AI Agent落地的關鍵點是什麽?以及AI Agent未來是怎樣的?
* AI Agent現狀,海外VS本土
目前,國內一些科技公司已經産出了數個知名大模型,因此孕育而生的Agent智能體應用也開始逐漸進入大衆視野。
例如百度將文心大模型應用到智能搜索、自動駕駛;阿裏將通義千問模型應用到高德地圖、優酷,盒馬等産品。華爲將其盤古模型應用到智能氣象、語音識別等。
一家叫面壁智能的創業也公司推出了他們的AI Agent産品ChatDev,可以在短時間內完成一個軟件或者一個小遊戲的開發,用戶所需要做的,只是提供給它一個要求。
值得注意的是,協同辦公領域似乎是巨頭們做AI Agent的“必經之地”。
例如釘釘魔法棒套件中,從聊天AI、文檔AI、會議AI、宜搭AI、TeambitionAI等都彙集了釘釘AI産品能力;騰訊會議中的“會議助理”功能提供了一些智能化的支持,如自動總結會議紀要、轉錄和翻譯;百度推出的智能工作平台如流搭載了文心大模型,可以實現智能創作、智能推薦等功能;字節跳動旗下的辦公軟件飛書宣布推出智能AI助手“MyAI”,旨在提升團隊協作效率。
曾有投資人對媒體調侃:“十個AI應用裏面,五個辦公Agent,三個AIGC,還有兩成是回春的數字人。”這不僅是國內AI Agent發展的現狀,其實從國外一些諸如谷歌、微軟等企業也在將AI Agent落于協同辦公場景。
其實在海外,AI Agent概念從出現到爆發,已經邁過多個階段。
在單一Agent階段,主要是針對不同領域和場景的特定任務,開發和部署專門的智能體。以GPTengineer爲例,給它一個需求,其就可以把代碼寫個大概。
而多Agent合作階段,是由不同角色的Agent自動合作完成複雜的任務。例如在MetaGPT上,如果讓其做一個股票分析的工具,它會把這個任務分別翻譯給産品經理、架構師、項目經理等5個角色,模擬整個的軟件開發中所有決策工作流。
不過,隨著微軟全新工具AutoGen的發布,AI Agent很快翻開了新的篇章。
AutoGen允許多個LLM智能體通過聊天來解決任務。LLM智能體可以扮演各種角色,如程序員、設計師,或者是各種角色的組合,對話過程就把任務解決了。這與MetaGPT不同,MetaGPT的角色模型是被定義好的,而AutoGen可以讓開發者自己定義Agent,還可以讓他們相互對話。
這是一個新的且富有創造性的Agent框架。在AutoGen發布的兩個星期內,星標量從390狂增到10K,並在Discord上吸引了5000多名成員。
微軟在AI Agent的布局較早。2023年3月Microsoft365Copilot發布,在當時便提示了一種基于LLM的應用開發範式,即Agent。目前,微軟CopilotStudio已經支持自定義ChatGPT助手無縫集成在CRM、ERP、OA等日常辦公系統中。
可以發現微軟的AI Agent能力主要是從其本身業務衍生出來的,AutoGen更像是一種自身基于業務所打造的能力的外放,這與OpenAI並不相同。
OpenAI開發的GPTs,以及推出的GPT-4Turbo和可定制AI Agent,使得每個人都可以打造自己的大模型應用。諸多業內人士認爲,超低的創建門檻和APP Store一樣的商業模型,會讓OpenAI快速構建GPTs生態。
OpenAI提供的是基礎Agent的構建能力,如工具調用、基于知識庫文件記憶能力等。這項産品的發布,使得AI Agent進入了另外一個新階段,即爲人人都可以打造自己的Agent提供了一種可能性。
值得注意的是,目前海外已經在零售、房地産、旅遊、客戶服務、人力資源、金融、制造業等多個領域出現AI Agent架構與産品。
例如零售領域的亞馬遜Alexa、Aktify、Regie.ai等;房地産領域的Epique、propertypen、Listingcopy等;客戶服務領域的Agent4、Ebi.Ai、JasonAI、Aide等;人力資源領域的AutonomousHRChatbot、AIInterviewCoach、CareersAI等。
總體來看,在AI Agent在底層技術、架構以及具體産品應用等方面都較爲完善。像OpenAI、微軟、谷歌這類科技巨頭,有著先發優勢。另一個可以看到的現象是,國內AI Agent的深度與廣度仍有所差距。
一個值得思考的問題是,Agent落地的關鍵是什麽?
* Agent落地的關鍵:模型?行業經驗?還是載體?
當前市場上的大多數Agent,包括OpenAI推出的GPTs,其實只是構建了一個基于特定知識庫或專業數據的Chatbot。這些智能體主要用于進行問答交互,如獲取行業資訊、報告等。
然而,在程序聯動和操作方面還有很大的提升空間。目前,我們還無法直接使用GPTs來操作SAP或金蝶等ERP系統,因爲這涉及到API的應用、授權、維護以及無API管理軟件的連接問題。
對于企業而言,如果GPTs等AI智能體僅用于知識問答,那麽其作用將非常有限,就像一個玩具一樣,因爲它目前還無法深入到企業的業務流程中。
這背後的原因有很多,包括模型能力、行業經驗、場景貼合度等,都會影響Agent的能力體現。
AI Agent需要具備感知環境、做出決策並執行適當行動的能力。在這些關鍵步驟中,最重要的是理解輸入給Agent的內容、進行推理、規劃、做出准確決策,並將其轉化爲可執行的原子動作序列,以實現最終目標。
目前,許多研究利用LLM作爲AI Agent的認知核心,這些模型的發展爲完成這一步驟提供了質量保證。因此,基于GPT-4的Agent表現得更加智能。
但就目前而言,包括GPT-4在內的所有大模型,能力仍需提升。
“底座模型問題都還很大,AI Agent真正落地還要等更優秀的模型。”某位身處大模型技術一線的業內人士對産業家說。
不過針對模型能力不足這一問題,智譜AI&清華KEG提出了一種對齊Agent能力的微調方法AgentTuning,該方法使用少量數據微調已有模型,顯著激發了模型的Agent能力,同時可以保持模型原有的通用能力。
* AI Agent的行業經驗對于其落地也至關重要。
“如果一篇論文提出了某種不同的訓練方法,OpenAI內部的Slack上會嗤之以鼻,因爲這些都是我們玩剩下的。但是當新的AI Agents論文出來的時候,我們才會認真興奮的討論。”這是OpenAI聯合創始人AndrejKarpathy最近發表的一段講話。
簡而言之,我們基于大模型能做出什麽樣的東西,說到底還是要靠行業經驗,而這恰是OpenAI等一衆大模型巨頭們所欠缺的。
要知道,企業要引入AI Agent進行流程優化,必須經過成本控制、投入預算、實現效率、安全管控等多方面嚴格及缜密的評估。這就要求技術供應商提供的必須是平台級解決方案,而不是只針對單一、個別場景需求來提供的AI Agent自動化解決方案。
大型企業引入新的AI技術不允許任何試錯成本,因此技術供應商給出的解決方案必須是開箱即用、具備行業Know-How術語和業務規則的真實智能體數字員工。也只有這樣的標准化AI Agent,才能被納入企業的內部編制中去統一管理和調度。
例如,一個醫療行業的AI Agent需要具備醫學知識,並能夠理解和處理醫療數據。一個金融行業的AI Agent需要具備金融知識,並能夠理解和處理金融數據。
AI Agent的落地效果也受限于應用場景。在如出行預訂中,得益于豐富的API等問題,AI Agent表現出色。而在如法律助手場景中,由于新知識的頻繁出現和API的不完善,實際應用面臨更多挑戰。
這一點,從國內AI Agent紛紛生長于協同辦公平台就可見一斑。
事實上,協同辦公平台本身具備良好的API接口和插件體系,這使得將大模型集成到現有工具中變得更加容易。
此外,許多企業和組織都在使用協同辦公軟件,這意味著大模型可以迅速覆蓋大量的潛在用戶。廣泛的用戶基礎可以加速大模型的疊代和優化過程,使其更好地滿足用戶需求。
還有大量的數據資源助于提高模型的性能,豐富的場景也可以推動大模型技術持續改進。
釘釘、飛書和企業微信在作爲Agent載體時,也各自具有不同的優勢。釘釘提供了完善的組織架構管理功能,可以方便地創建、管理和調整團隊架構,使得企業能夠快速搭建適應其需求的組織結構。
飛書強調實時協作和溝通,支持多人在線編輯文檔、共同討論等功能,有助于團隊高效地完成協作任務。其特有的一體化,使得整個辦公流程更加標准化。
企業微信與微信互通,這使得其AI Agent有可能借助微信龐大的用戶數據和應用場景,提供更加個性化和場景化的服務。
站在這個角度來看,國內AI Agent紮堆協同辦公領域,則變得理所當然。而找到一個適合AI Agent落地的場景或者說載體更爲重要。
不過,除了協同辦公,還有許多其他載體可能更適合AI Agent的落地應用。
例如智能客服、智能助手、RPA、CRM等。具體來看,在智能客服方面,AI Agent可以自動回答用戶的問題,處理投訴和建議,提高客戶滿意度和效率。在智能助手方面,蘋果公司的Siri、谷歌公司的GoogleAssistant和亞馬遜公司的Alexa都是智能助手的代表。
在智能流程自動化方面,許多企業采用智能流程自動化工具,如UiPath、BluePrism等,來自動完成某些特定的業務流程。
在智能營銷方面,許多營銷平台都集成了AI Agent,如HubSpot、Salesforce等。這些平台的AI Agent可以通過數據分析和機器學習技術,提供精准的營銷建議和預測,幫助企業更好地了解客戶需求,提高銷售業績。
總而言之,模型能力是核心,行業經驗是關鍵,載體是保障。無論是模型能力還是行業經驗抑或是載體都是AI Agent落地的關鍵。值得注意的是,國內的軟件業態,倒逼國內廠商造就了一身定制化、個性化能力,這種能力側面驗證了國內企業在技術落地上的潛力,這將會進一步推動Agent的落地。
* AI Agent的終局是什麽?
在文章開篇的“西部世界小鎮(Westworldsimulation)”裏,這些智能體可以與別人和環境交流(互相注意到彼此舉動、發起對話或者問候)、反思這些觀察結果(形成獨特的個人觀點)、制定每天的計劃。他們擁有自己記憶和目標,會産生可信的個人和湧現的社交行爲,而不是通過預先設計實現。
例如從用戶指定的單一任務開始,即一個AI Agent想要舉辦情人節聚會,AI Agent們在接下來的時間裏會自發的傳播邀請、認識新朋友、互相約出參加聚會的日期,並協調在正確的時間一起出現在聚會上。
這是Agent項目裏具有代表性的應用。人們之所以爲這個項目感到驚訝,是因爲Agent的交互出現了人類意料之外的現象。AI Agent爆發的一段時間,人們普遍認爲補齊了大模型短板的AI Agent更具備實用性,將是大模型重要落地方向。
隨著Agent的構建越發簡單,Agent生態的成熟會讓C端Agent出現百花齊放的局面,面對用戶,Agent將會更加接地氣,引起新一輪的爆發。
但就目前而言,這一路徑的商業化存在諸多問題。拿遊戲場景而言,目前收費主要來源于出售遊戲裝備、皮膚等方式。而AI Agent的價值無法體現在這些固有的變現途徑上。並且就目前Agent落地效果來看,未出現顛覆性的能力,C端用戶是否會爲其買單無法得知。
更值得注意的是,隨著讓C端Agent百花齊放,其應用價值方面也隨邊際效應而無限趨向于更小量級。換言之,AI Agent能否成爲AI大模型從C端商業化爆發一個最核心應用方向,還需時間驗證。且即使未來會成爲C端商業化爆發一個最核心應用方向,但其“壽命”並不長。
* 一個事實是,AI Agent最終的落腳點或將在B端。
比爾蓋茨認爲,智能體作爲下一個平台,將會影響人們使用軟件的方式以及軟件的編寫方式。它更擅長查找信息並爲用戶總結信息,能夠會爲用戶找到最優惠的價格,將取代搜索網站及電商網站,也將取代文字處理器、電子表格和其它生産力應用程序。並且,現在各自獨立的搜索廣告、廣告社交網絡、購物、生産力軟件等,都將變成智能體這一項業務。Agent會徹底改變應用軟件的打開方式。
這些變革來臨之前,相對于 Agent本身帶來的影響,如何構建一個Agent,是一個更值得關注的問題。
Agent構建平台上,企業或將可以自己構建自己RPA、CRM、辦公OA等一系列管理軟件;軟件廠商也可以基于此平台構建軟件爲企業提供服務。
對于身處或准備進入AI Agent領域的玩家而言,找到切入點以及好的商業模式至關重要。
未來AI Agent的發展將不僅僅局限于單體智能,而是會擴展到物的智能和機器人的聯動。
從群體智能的角度來看,ToC可能會形成更大的社區化虛擬組織,每個人的Agent都能通過虛擬數據連接在一起;而ToB則可能形成虛擬的組織和企業,不同的企業和員工都能通過智能體納入到網絡當中。
最終,整個社會將變成一個巨大的虛實結合的網絡,形成“智聯網”。在這個網絡中,不同的智能體將提供更強的生産力,重新塑造整個生産關系,從而提升整個社會的産能。
因此,AI Agent的發展前景非常廣闊,它們將不斷擴展其應用範圍和影響力,爲未來的社會發展帶來巨大的變革和機遇。
時至今日,AI Agent雖然帶來了諸多想象力,卻仍舊存在諸多質疑。技術發展之路本就充滿質疑與批判,科技變革對于任何一個企業與個體都是一場機遇,關鍵在于如何把握它。---來源: 钛媒體-