“十個(gè)AI應(yīng)用里面,五個(gè)辦公Agent,三個(gè)AIGC,還有兩成是回春的數(shù)字人。”那么,Agent到底是不是大模型的AGI終局產(chǎn)品?
作者|斗斗
編輯|皮爺
出品|產(chǎn)業(yè)家
今年4月份,斯坦福和谷歌的研究者共同創(chuàng)建了一個(gè)“西部世界小鎮(zhèn)(Westworldsimulation)”,在這個(gè)小鎮(zhèn)里,25個(gè)智能體可執(zhí)行類似人類的日常行為,比如起床后做早餐然后去上班,藝術(shù)家作畫,作家寫作。
這些就是如今人們共同談?wù)摰摹癆I Agent實(shí)驗(yàn)”。而在國(guó)內(nèi)的今年下半年,大模型市場(chǎng)的玩家們,似乎正齊刷刷地轉(zhuǎn)向AI Agent——這個(gè)清晰可見的AGI終局產(chǎn)品。
一組數(shù)據(jù)顯示,截止11月中旬,AI Agent賽道發(fā)生融資事件13起,總?cè)谫Y金額約735億人民幣,公司融資均值為56.54億人民幣。
而在國(guó)外,這一領(lǐng)域亦是火爆?!爸辽儆?00個(gè)項(xiàng)目正致力于將AI代理商業(yè)化,近10萬(wàn)名開發(fā)人員正在構(gòu)建自主Agent。”外媒MattSchlicht曾表示。
AI Agent為何如此火爆?
關(guān)于AI Agent的想象力,一個(gè)高贊回答是:“大語(yǔ)言模型只能編個(gè)貪吃蛇,而AI Agent可以整出一個(gè)王者榮耀。”
成熟的AI Agent可以使軟件生產(chǎn)大幅降低成本。未來(lái)Coding工作流中會(huì)很多Agent臨時(shí)寫成的軟件和測(cè)試方案,不追求長(zhǎng)期的可復(fù)用性,可以隨用隨拋。目前一家軟件行業(yè)巨頭動(dòng)輒上萬(wàn)甚至十萬(wàn)人,有了AI Agent之后研發(fā)、交付需要耗費(fèi)的人力和資金將大幅降低。而且使得軟件可以靈活地解決更多長(zhǎng)尾需求。
此外,AI Agent或?qū)長(zhǎng)LM搭建一套框架來(lái)進(jìn)行深度思考和分析,從而做出更復(fù)雜和可靠的決策。
總之,就像微軟創(chuàng)始人比爾·蓋茨所說(shuō)的那樣:“誰(shuí)能主宰個(gè)人助理Agent,那才是大事。因?yàn)槟銓⒂肋h(yuǎn)不去搜索網(wǎng)站,不去生產(chǎn)力網(wǎng)站,不去亞馬遜。”
值得注意的是,在這種巨大的技術(shù)變革下,目前我們?nèi)詻]有切身體會(huì)到AI Agent所帶來(lái)的紅利和變化。很明顯,AI Agent的發(fā)展仍面臨一些難題。
一些值得探討的問題是,國(guó)內(nèi)外AI Agent的發(fā)展現(xiàn)狀如何?AI Agent落地的關(guān)鍵點(diǎn)是什么?以及AI Agent未來(lái)是怎樣的?
一、AI Agent現(xiàn)狀,海外VS本土
目前,國(guó)內(nèi)一些科技公司已經(jīng)產(chǎn)出了數(shù)個(gè)知名大模型,因此孕育而生的Agent智能體應(yīng)用也開始逐漸進(jìn)入大眾視野。
例如百度將文心大模型應(yīng)用到智能搜索、自動(dòng)駕駛;阿里將通義千問模型應(yīng)用到高德地圖、優(yōu)酷,盒馬等產(chǎn)品。華為將其盤古模型應(yīng)用到智能氣象、語(yǔ)音識(shí)別等。
一家叫面壁智能的創(chuàng)業(yè)也公司推出了他們的AI Agent產(chǎn)品ChatDev,可以在短時(shí)間內(nèi)完成一個(gè)軟件或者一個(gè)小游戲的開發(fā),用戶所需要做的,只是提供給它一個(gè)要求。
值得注意的是,協(xié)同辦公領(lǐng)域似乎是巨頭們做AI Agent的“必經(jīng)之地”。
例如釘釘魔法棒套件中,從聊天AI、文檔AI、會(huì)議AI、宜搭A(yù)I、TeambitionAI等都匯集了釘釘AI產(chǎn)品能力;騰訊會(huì)議中的“會(huì)議助理”功能提供了一些智能化的支持,如自動(dòng)總結(jié)會(huì)議紀(jì)要、轉(zhuǎn)錄和翻譯;百度推出的智能工作平臺(tái)如流搭載了文心大模型,可以實(shí)現(xiàn)智能創(chuàng)作、智能推薦等功能;字節(jié)跳動(dòng)旗下的辦公軟件飛書宣布推出智能AI助手“MyAI”,旨在提升團(tuán)隊(duì)協(xié)作效率。
曾有投資人對(duì)媒體調(diào)侃:“十個(gè)AI應(yīng)用里面,五個(gè)辦公Agent,三個(gè)AIGC,還有兩成是回春的數(shù)字人?!?/strong>這不僅是國(guó)內(nèi)AI Agent發(fā)展的現(xiàn)狀,其實(shí)從國(guó)外一些諸如谷歌、微軟等企業(yè)也在將AI Agent落于協(xié)同辦公場(chǎng)景。
其實(shí)在海外,AI Agent概念從出現(xiàn)到爆發(fā),已經(jīng)邁過(guò)多個(gè)階段。
在單一Agent階段,主要是針對(duì)不同領(lǐng)域和場(chǎng)景的特定任務(wù),開發(fā)和部署專門的智能體。以GPTengineer為例,給它一個(gè)需求,其就可以把代碼寫個(gè)大概。
而多Agent合作階段,是由不同角色的Agent自動(dòng)合作完成復(fù)雜的任務(wù)。例如在MetaGPT上,如果讓其做一個(gè)股票分析的工具,它會(huì)把這個(gè)任務(wù)分別翻譯給產(chǎn)品經(jīng)理、架構(gòu)師、項(xiàng)目經(jīng)理等5個(gè)角色,模擬整個(gè)的軟件開發(fā)中所有決策工作流。
不過(guò),隨著微軟全新工具AutoGen的發(fā)布,AI Agent很快翻開了新的篇章。
AutoGen允許多個(gè)LLM智能體通過(guò)聊天來(lái)解決任務(wù)。LLM智能體可以扮演各種角色,如程序員、設(shè)計(jì)師,或者是各種角色的組合,對(duì)話過(guò)程就把任務(wù)解決了。這與MetaGPT不同,MetaGPT的角色模型是被定義好的,而AutoGen可以讓開發(fā)者自己定義Agent,還可以讓他們相互對(duì)話。
這是一個(gè)新的且富有創(chuàng)造性的Agent框架。在AutoGen發(fā)布的兩個(gè)星期內(nèi),星標(biāo)量從390狂增到10K,并在Discord上吸引了5000多名成員。
微軟在AI Agent的布局較早。2023年3月Microsoft365Copilot發(fā)布,在當(dāng)時(shí)便提示了一種基于LLM的應(yīng)用開發(fā)范式,即Agent。目前,微軟CopilotStudio已經(jīng)支持自定義ChatGPT助手無(wú)縫集成在CRM、ERP、OA等日常辦公系統(tǒng)中。
可以發(fā)現(xiàn)微軟的AI Agent能力主要是從其本身業(yè)務(wù)衍生出來(lái)的,AutoGen更像是一種自身基于業(yè)務(wù)所打造的能力的外放,這與OpenAI并不相同。
OpenAI開發(fā)的GPTs,以及推出的GPT-4Turbo和可定制AI Agent,使得每個(gè)人都可以打造自己的大模型應(yīng)用。諸多業(yè)內(nèi)人士認(rèn)為,超低的創(chuàng)建門檻和APP Store一樣的商業(yè)模型,會(huì)讓OpenAI快速構(gòu)建GPTs生態(tài)。
OpenAI提供的是基礎(chǔ)Agent的構(gòu)建能力,如工具調(diào)用、基于知識(shí)庫(kù)文件記憶能力等。這項(xiàng)產(chǎn)品的發(fā)布,使得AI Agent進(jìn)入了另外一個(gè)新階段,即為人人都可以打造自己的Agent提供了一種可能性。
值得注意的是,目前海外已經(jīng)在零售、房地產(chǎn)、旅游、客戶服務(wù)、人力資源、金融、制造業(yè)等多個(gè)領(lǐng)域出現(xiàn)AI Agent架構(gòu)與產(chǎn)品。
例如零售領(lǐng)域的亞馬遜Alexa、Aktify、Regie.ai等;房地產(chǎn)領(lǐng)域的Epique、propertypen、Listingcopy等;客戶服務(wù)領(lǐng)域的Agent4、Ebi.Ai、JasonAI、Aide等;人力資源領(lǐng)域的AutonomousHRChatbot、AIInterviewCoach、CareersAI等。
總體來(lái)看,在AI Agent在底層技術(shù)、架構(gòu)以及具體產(chǎn)品應(yīng)用等方面都較為完善。像OpenAI、微軟、谷歌這類科技巨頭,有著先發(fā)優(yōu)勢(shì)。另一個(gè)可以看到的現(xiàn)象是,國(guó)內(nèi)AI Agent的深度與廣度仍有所差距。
一個(gè)值得思考的問題是,Agent落地的關(guān)鍵是什么?
二、Agent落地的關(guān)鍵:
模型?行業(yè)經(jīng)驗(yàn)?還是載體?
當(dāng)前市場(chǎng)上的大多數(shù)Agent,包括OpenAI推出的GPTs,其實(shí)只是構(gòu)建了一個(gè)基于特定知識(shí)庫(kù)或?qū)I(yè)數(shù)據(jù)的Chatbot。這些智能體主要用于進(jìn)行問答交互,如獲取行業(yè)資訊、報(bào)告等。
然而,在程序聯(lián)動(dòng)和操作方面還有很大的提升空間。目前,我們還無(wú)法直接使用GPTs來(lái)操作SAP或金蝶等ERP系統(tǒng),因?yàn)檫@涉及到API的應(yīng)用、授權(quán)、維護(hù)以及無(wú)API管理軟件的連接問題。
對(duì)于企業(yè)而言,如果GPTs等AI智能體僅用于知識(shí)問答,那么其作用將非常有限,就像一個(gè)玩具一樣,因?yàn)樗壳斑€無(wú)法深入到企業(yè)的業(yè)務(wù)流程中。
這背后的原因有很多,包括模型能力、行業(yè)經(jīng)驗(yàn)、場(chǎng)景貼合度等,都會(huì)影響Agent的能力體現(xiàn)。
AI Agent需要具備感知環(huán)境、做出決策并執(zhí)行適當(dāng)行動(dòng)的能力。在這些關(guān)鍵步驟中,最重要的是理解輸入給Agent的內(nèi)容、進(jìn)行推理、規(guī)劃、做出準(zhǔn)確決策,并將其轉(zhuǎn)化為可執(zhí)行的原子動(dòng)作序列,以實(shí)現(xiàn)最終目標(biāo)。
目前,許多研究利用LLM作為AI Agent的認(rèn)知核心,這些模型的發(fā)展為完成這一步驟提供了質(zhì)量保證。因此,基于GPT-4的Agent表現(xiàn)得更加智能。
但就目前而言,包括GPT-4在內(nèi)的所有大模型,能力仍需提升。
“底座模型問題都還很大,AI Agent真正落地還要等更優(yōu)秀的模型。”某位身處大模型技術(shù)一線的業(yè)內(nèi)人士對(duì)產(chǎn)業(yè)家說(shuō)。
不過(guò)針對(duì)模型能力不足這一問題,智譜AI&清華KEG提出了一種對(duì)齊Agent能力的微調(diào)方法AgentTuning,該方法使用少量數(shù)據(jù)微調(diào)已有模型,顯著激發(fā)了模型的Agent能力,同時(shí)可以保持模型原有的通用能力。
AI Agent的行業(yè)經(jīng)驗(yàn)對(duì)于其落地也至關(guān)重要。
“如果一篇論文提出了某種不同的訓(xùn)練方法,OpenAI內(nèi)部的Slack上會(huì)嗤之以鼻,因?yàn)檫@些都是我們玩剩下的。但是當(dāng)新的AI Agents論文出來(lái)的時(shí)候,我們才會(huì)認(rèn)真興奮的討論。”這是OpenAI聯(lián)合創(chuàng)始人AndrejKarpathy最近發(fā)表的一段講話。
簡(jiǎn)而言之,我們基于大模型能做出什么樣的東西,說(shuō)到底還是要靠行業(yè)經(jīng)驗(yàn),而這恰是OpenAI等一眾大模型巨頭們所欠缺的。
要知道,企業(yè)要引入AI Agent進(jìn)行流程優(yōu)化,必須經(jīng)過(guò)成本控制、投入預(yù)算、實(shí)現(xiàn)效率、安全管控等多方面嚴(yán)格及縝密的評(píng)估。這就要求技術(shù)供應(yīng)商提供的必須是平臺(tái)級(jí)解決方案,而不是只針對(duì)單一、個(gè)別場(chǎng)景需求來(lái)提供的AI Agent自動(dòng)化解決方案。
大型企業(yè)引入新的AI技術(shù)不允許任何試錯(cuò)成本,因此技術(shù)供應(yīng)商給出的解決方案必須是開箱即用、具備行業(yè)Know-How術(shù)語(yǔ)和業(yè)務(wù)規(guī)則的真實(shí)智能體數(shù)字員工。也只有這樣的標(biāo)準(zhǔn)化AI Agent,才能被納入企業(yè)的內(nèi)部編制中去統(tǒng)一管理和調(diào)度。
例如,一個(gè)醫(yī)療行業(yè)的AI Agent需要具備醫(yī)學(xué)知識(shí),并能夠理解和處理醫(yī)療數(shù)據(jù)。一個(gè)金融行業(yè)的AI Agent需要具備金融知識(shí),并能夠理解和處理金融數(shù)據(jù)。
AI Agent的落地效果也受限于應(yīng)用場(chǎng)景。在如出行預(yù)訂中,得益于豐富的API等問題,AI Agent表現(xiàn)出色。而在如法律助手場(chǎng)景中,由于新知識(shí)的頻繁出現(xiàn)和API的不完善,實(shí)際應(yīng)用面臨更多挑戰(zhàn)。
這一點(diǎn),從國(guó)內(nèi)AI Agent紛紛生長(zhǎng)于協(xié)同辦公平臺(tái)就可見一斑。
事實(shí)上,協(xié)同辦公平臺(tái)本身具備良好的API接口和插件體系,這使得將大模型集成到現(xiàn)有工具中變得更加容易。
此外,許多企業(yè)和組織都在使用協(xié)同辦公軟件,這意味著大模型可以迅速覆蓋大量的潛在用戶。廣泛的用戶基礎(chǔ)可以加速大模型的迭代和優(yōu)化過(guò)程,使其更好地滿足用戶需求。
還有大量的數(shù)據(jù)資源助于提高模型的性能,豐富的場(chǎng)景也可以推動(dòng)大模型技術(shù)持續(xù)改進(jìn)。
釘釘、飛書和企業(yè)微信在作為Agent載體時(shí),也各自具有不同的優(yōu)勢(shì)。釘釘提供了完善的組織架構(gòu)管理功能,可以方便地創(chuàng)建、管理和調(diào)整團(tuán)隊(duì)架構(gòu),使得企業(yè)能夠快速搭建適應(yīng)其需求的組織結(jié)構(gòu)。
飛書強(qiáng)調(diào)實(shí)時(shí)協(xié)作和溝通,支持多人在線編輯文檔、共同討論等功能,有助于團(tuán)隊(duì)高效地完成協(xié)作任務(wù)。其特有的一體化,使得整個(gè)辦公流程更加標(biāo)準(zhǔn)化。
企業(yè)微信與微信互通,這使得其AI Agent有可能借助微信龐大的用戶數(shù)據(jù)和應(yīng)用場(chǎng)景,提供更加個(gè)性化和場(chǎng)景化的服務(wù)。
站在這個(gè)角度來(lái)看,國(guó)內(nèi)AI Agent扎堆協(xié)同辦公領(lǐng)域,則變得理所當(dāng)然。而找到一個(gè)適合AI Agent落地的場(chǎng)景或者說(shuō)載體更為重要。
不過(guò),除了協(xié)同辦公,還有許多其他載體可能更適合AI Agent的落地應(yīng)用。
例如智能客服、智能助手、RPA、CRM等。具體來(lái)看,在智能客服方面,AI Agent可以自動(dòng)回答用戶的問題,處理投訴和建議,提高客戶滿意度和效率。在智能助手方面,蘋果公司的Siri、谷歌公司的GoogleAssistant和亞馬遜公司的Alexa都是智能助手的代表。
在智能流程自動(dòng)化方面,許多企業(yè)采用智能流程自動(dòng)化工具,如UiPath、BluePrism等,來(lái)自動(dòng)完成某些特定的業(yè)務(wù)流程。
在智能營(yíng)銷方面,許多營(yíng)銷平臺(tái)都集成了AI Agent,如HubSpot、Salesforce等。這些平臺(tái)的AI Agent可以通過(guò)數(shù)據(jù)分析和機(jī)器學(xué)習(xí)技術(shù),提供精準(zhǔn)的營(yíng)銷建議和預(yù)測(cè),幫助企業(yè)更好地了解客戶需求,提高銷售業(yè)績(jī)。
總而言之,模型能力是核心,行業(yè)經(jīng)驗(yàn)是關(guān)鍵,載體是保障。無(wú)論是模型能力還是行業(yè)經(jīng)驗(yàn)抑或是載體都是AI Agent落地的關(guān)鍵。值得注意的是,國(guó)內(nèi)的軟件業(yè)態(tài),倒逼國(guó)內(nèi)廠商造就了一身定制化、個(gè)性化能力,這種能力側(cè)面驗(yàn)證了國(guó)內(nèi)企業(yè)在技術(shù)落地上的潛力,這將會(huì)進(jìn)一步推動(dòng)Agent的落地。
三、AI Agent的終局是什么?
在文章開篇的“西部世界小鎮(zhèn)(Westworldsimulation)”里,這些智能體可以與別人和環(huán)境交流(互相注意到彼此舉動(dòng)、發(fā)起對(duì)話或者問候)、反思這些觀察結(jié)果(形成獨(dú)特的個(gè)人觀點(diǎn))、制定每天的計(jì)劃。他們擁有自己記憶和目標(biāo),會(huì)產(chǎn)生可信的個(gè)人和涌現(xiàn)的社交行為,而不是通過(guò)預(yù)先設(shè)計(jì)實(shí)現(xiàn)。
例如從用戶指定的單一任務(wù)開始,即一個(gè)AI Agent想要舉辦情人節(jié)聚會(huì),AI Agent們?cè)诮酉聛?lái)的時(shí)間里會(huì)自發(fā)的傳播邀請(qǐng)、認(rèn)識(shí)新朋友、互相約出參加聚會(huì)的日期,并協(xié)調(diào)在正確的時(shí)間一起出現(xiàn)在聚會(huì)上。
這是Agent項(xiàng)目里具有代表性的應(yīng)用。人們之所以為這個(gè)項(xiàng)目感到驚訝,是因?yàn)锳gent的交互出現(xiàn)了人類意料之外的現(xiàn)象。AI Agent爆發(fā)的一段時(shí)間,人們普遍認(rèn)為補(bǔ)齊了大模型短板的AI Agent更具備實(shí)用性,將是大模型重要落地方向。
隨著Agent的構(gòu)建越發(fā)簡(jiǎn)單,Agent生態(tài)的成熟會(huì)讓C端Agent出現(xiàn)百花齊放的局面,面對(duì)用戶,Agent將會(huì)更加接地氣,引起新一輪的爆發(fā)。
但就目前而言,這一路徑的商業(yè)化存在諸多問題。拿游戲場(chǎng)景而言,目前收費(fèi)主要來(lái)源于出售游戲裝備、皮膚等方式。而AI Agent的價(jià)值無(wú)法體現(xiàn)在這些固有的變現(xiàn)途徑上。并且就目前Agent落地效果來(lái)看,未出現(xiàn)顛覆性的能力,C端用戶是否會(huì)為其買單無(wú)法得知。
更值得注意的是,隨著讓C端Agent百花齊放,其應(yīng)用價(jià)值方面也隨邊際效應(yīng)而無(wú)限趨向于更小量級(jí)。換言之,AI Agent能否成為AI大模型從C端商業(yè)化爆發(fā)一個(gè)最核心應(yīng)用方向,還需時(shí)間驗(yàn)證。且即使未來(lái)會(huì)成為C端商業(yè)化爆發(fā)一個(gè)最核心應(yīng)用方向,但其“壽命”并不長(zhǎng)。
一個(gè)事實(shí)是,AI Agent最終的落腳點(diǎn)或?qū)⒃贐端。
比爾蓋茨認(rèn)為,智能體作為下一個(gè)平臺(tái),將會(huì)影響人們使用軟件的方式以及軟件的編寫方式。它更擅長(zhǎng)查找信息并為用戶總結(jié)信息,能夠會(huì)為用戶找到最優(yōu)惠的價(jià)格,將取代搜索網(wǎng)站及電商網(wǎng)站,也將取代文字處理器、電子表格和其它生產(chǎn)力應(yīng)用程序。并且,現(xiàn)在各自獨(dú)立的搜索廣告、廣告社交網(wǎng)絡(luò)、購(gòu)物、生產(chǎn)力軟件等,都將變成智能體這一項(xiàng)業(yè)務(wù)。Agent會(huì)徹底改變應(yīng)用軟件的打開方式。
這些變革來(lái)臨之前,相對(duì)于 Agent本身帶來(lái)的影響,如何構(gòu)建一個(gè)Agent,是一個(gè)更值得關(guān)注的問題。
Agent構(gòu)建平臺(tái)上,企業(yè)或?qū)⒖梢宰约簶?gòu)建自己RPA、CRM、辦公OA等一系列管理軟件;軟件廠商也可以基于此平臺(tái)構(gòu)建軟件為企業(yè)提供服務(wù)。
對(duì)于身處或準(zhǔn)備進(jìn)入AI Agent領(lǐng)域的玩家而言,找到切入點(diǎn)以及好的商業(yè)模式至關(guān)重要。
未來(lái)AI Agent的發(fā)展將不僅僅局限于單體智能,而是會(huì)擴(kuò)展到物的智能和機(jī)器人的聯(lián)動(dòng)。
從群體智能的角度來(lái)看,ToC可能會(huì)形成更大的社區(qū)化虛擬組織,每個(gè)人的Agent都能通過(guò)虛擬數(shù)據(jù)連接在一起;而ToB則可能形成虛擬的組織和企業(yè),不同的企業(yè)和員工都能通過(guò)智能體納入到網(wǎng)絡(luò)當(dāng)中。
最終,整個(gè)社會(huì)將變成一個(gè)巨大的虛實(shí)結(jié)合的網(wǎng)絡(luò),形成“智聯(lián)網(wǎng)”。在這個(gè)網(wǎng)絡(luò)中,不同的智能體將提供更強(qiáng)的生產(chǎn)力,重新塑造整個(gè)生產(chǎn)關(guān)系,從而提升整個(gè)社會(huì)的產(chǎn)能。
因此,AI Agent的發(fā)展前景非常廣闊,它們將不斷擴(kuò)展其應(yīng)用范圍和影響力,為未來(lái)的社會(huì)發(fā)展帶來(lái)巨大的變革和機(jī)遇。
時(shí)至今日,AI Agent雖然帶來(lái)了諸多想象力,卻仍舊存在諸多質(zhì)疑。技術(shù)發(fā)展之路本就充滿質(zhì)疑與批判,科技變革對(duì)于任何一個(gè)企業(yè)與個(gè)體都是一場(chǎng)機(jī)遇,關(guān)鍵在于如何把握它。
本文來(lái)自投稿,不代表增長(zhǎng)黑客立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:http://gptmaths.com/quan/111254.html