AI變革軟件開(kāi)發(fā),Agent基礎(chǔ)設(shè)施棧的三個(gè)關(guān)鍵變化
AI技術(shù)的發(fā)展正在深刻改變軟件開(kāi)發(fā)的格局,尤其是AI代理(Agent)的崛起,正在推動(dòng)軟件構(gòu)建、部署和擴(kuò)展方式的根本性變革。本文深入探討了AI代理對(duì)軟件開(kāi)發(fā)基礎(chǔ)設(shè)施棧的三個(gè)關(guān)鍵影響:工具層、數(shù)據(jù)層和編排層的變化。
2025年,AI代理的崛起正在變得不可阻擋。
你能想象,一家只有20人的公司就能在不到2年時(shí)間創(chuàng)造1億美元的年度經(jīng)常性收入。
這就是AI驅(qū)動(dòng)的增長(zhǎng)。像這樣的例子還不在少數(shù),在Cursor、Bolt、Lovable和Mercor等公司上我們也能看到這種趨勢(shì),詳見(jiàn)《吊打蘋(píng)果!一個(gè)人狂賺3000萬(wàn),AI的創(chuàng)業(yè)姿勢(shì)變了》。
這揭示了AI創(chuàng)業(yè)的變化:在Agent的輔助下,產(chǎn)品開(kāi)發(fā)不再受員工人數(shù)或傳統(tǒng)開(kāi)發(fā)周期的限制。這是一次對(duì)軟件構(gòu)建、部署和擴(kuò)展方式的根本性變革。
根據(jù)YC管理合伙人賈里德·弗里德曼在YouTube上透露的信息:其W25的1/4的創(chuàng)業(yè)公司中,有 95% 的代碼庫(kù)是由AI生成。也就是說(shuō),目前YC正在孵化的這一批次創(chuàng)業(yè)公司中,有1/4的代碼庫(kù)幾乎完全由AI生成。
而隨著新應(yīng)用的出現(xiàn),也對(duì)基礎(chǔ)設(shè)施提出了更高的要求。
不久前,國(guó)外知名投資機(jī)構(gòu)Madrona就發(fā)布了”AI代理基礎(chǔ)設(shè)施技術(shù)棧”圖表,全面展示了Agent崛起對(duì)當(dāng)前Agent生態(tài)系統(tǒng)在各個(gè)層面的影響。
01 軟件的生產(chǎn)方式變了
隨著代理的落地越來(lái)越多,對(duì)AI應(yīng)用的基礎(chǔ)設(shè)施層提出了新的要求。
我們從2024年6月撰寫(xiě)“人工智能代理基礎(chǔ)設(shè)施的崛起”一文以來(lái)就一直在跟蹤這一演變。當(dāng)時(shí),市場(chǎng)格局很分散,以DIY解決方案為主,當(dāng)時(shí)開(kāi)發(fā)人員優(yōu)先考慮靈活性,以便嘗試不同的方法。
有一大批新公司正在為未來(lái)的代理狀態(tài)構(gòu)建基礎(chǔ)設(shè)施,但這些公司面臨著不斷變化的目標(biāo)。如今,這種情況發(fā)生了巨大變化。
比如,Neon提供了一種無(wú)服務(wù)器方法,將存儲(chǔ)和計(jì)算分離。根據(jù)Neon的報(bào)告,現(xiàn)在AI代理現(xiàn)在在其平臺(tái)上創(chuàng)建數(shù)據(jù)庫(kù)的數(shù)據(jù)是人類開(kāi)發(fā)人員的4倍多,從而加速了Neon數(shù)據(jù)的增長(zhǎng)。
Browserbase等專用AI代理基礎(chǔ)設(shè)施組件也出現(xiàn)了類似的增長(zhǎng)。例如,Browserbase的Stagehand UI自動(dòng)化庫(kù)最近每月的npm安裝量超過(guò)了50萬(wàn)。(Browserbase是一個(gè)開(kāi)發(fā)者平臺(tái)。專注于運(yùn)行、管理和監(jiān)控?zé)o頭瀏覽器,支持大規(guī)模數(shù)據(jù)采集、自動(dòng)化測(cè)試和內(nèi)容抓取等功能。)
這些不僅僅是簡(jiǎn)單的數(shù)據(jù)增長(zhǎng),而是軟件構(gòu)建和部署方式發(fā)生根本性轉(zhuǎn)變的信號(hào)。這種轉(zhuǎn)變?yōu)榇響?yīng)用程序及其支持的基礎(chǔ)架構(gòu)帶來(lái)了更多的機(jī)會(huì)。
已經(jīng)被驗(yàn)證的Agent落地路徑
一年前,大家對(duì)Agent落地路徑并不清晰,當(dāng)時(shí)Agent開(kāi)發(fā)的特點(diǎn)是進(jìn)行大量實(shí)驗(yàn)。開(kāi)發(fā)者需要從頭去構(gòu)建產(chǎn)品,更多優(yōu)先考慮產(chǎn)品的靈活性。但今天,情況發(fā)生了巨大變化,Agent領(lǐng)域出現(xiàn)了一些得到驗(yàn)證的模式,而這種模式正在得到應(yīng)用。
這些模式都在我們1月發(fā)布的代理格局的分析中有過(guò)展示?,F(xiàn)在常見(jiàn)的Agent大致有以下幾類:
1)下一代副駕駛是情境感知助手,可以主動(dòng)協(xié)助完成復(fù)雜任務(wù),例如Bolt.new、AirOps和Colimit;
2)隊(duì)友代理,例如 Ravenna、Sailplane和Basepilot,這些產(chǎn)品擁有更強(qiáng)的自主性,能夠完成多步驟的工作流程;
3)代理組織引入了協(xié)作系統(tǒng),其中多個(gè)專門的代理協(xié)同工作,如Aaru一樣(Aaru是一家AI預(yù)測(cè)公司,使用多智能體AI系統(tǒng),根據(jù)專有和公共數(shù)據(jù)源更精確地模擬人類行為,曾預(yù)測(cè)哈里斯將擊敗特朗普);
4)代理即服務(wù),提供專門的代理功能作為面向開(kāi)發(fā)人員的服務(wù),而不是面向大眾的產(chǎn)品。
02 Agent興起之下,基礎(chǔ)設(shè)施堆棧的三個(gè)變化
隨著Agent發(fā)展越來(lái)越成熟,AI Agent基礎(chǔ)架構(gòu)堆棧的三個(gè)層級(jí)(工具、數(shù)據(jù)和編排)都發(fā)生了巨大的變化。
工具層:讓Agent具備能力
工具層經(jīng)歷了最為顯著的擴(kuò)張,反映了Agent交互的日益復(fù)雜化。一些核心變化包括:
1)瀏覽器基礎(chǔ)設(shè)施和UI自動(dòng)化
Agent越來(lái)越需要與可視化網(wǎng)絡(luò)進(jìn)行交互,而不僅僅是API。Browserbase、Lightpanda和 Browserless等公司正在構(gòu)建實(shí)現(xiàn)這一目標(biāo)的基礎(chǔ)設(shè)施,而Stagehand等專業(yè)服務(wù)則為常見(jiàn)模式提供了更高級(jí)別的抽象。
2)身份驗(yàn)證和安全
當(dāng)Agent代表用戶行動(dòng)時(shí),身份驗(yàn)證和安全性將進(jìn)入新的層面。Clerk、Anon 和 Statics.ai等公司正在率先推出“代理身份驗(yàn)證”——以代理原生方式管理權(quán)限、憑證和安全性。
3)工具發(fā)現(xiàn)與集成
Anthropic模型的上下文協(xié)議(MCP)正在成為潛在的“AI 代理的TCP/IP”,為代理在保持上下文的前提下,提供提供標(biāo)準(zhǔn)化的交互方式。Stripe、Neo4j和Cloudflare等主要參與者已經(jīng)提供MCP服務(wù)器,這表明這可能成為工具集成的關(guān)鍵標(biāo)準(zhǔn)。
Composio和Arcade.dev等公司正在這些協(xié)議之上構(gòu)建抽象層。Composio提供與MCP兼容的Gmail和Linear等熱門應(yīng)用程序訪問(wèn)權(quán)限,并通過(guò)TypeScript和Python SDK為開(kāi)發(fā)人員提供標(biāo)準(zhǔn)化接口。
同時(shí),Arcade.dev通過(guò)與OpenAI規(guī)范兼容的統(tǒng)一API層簡(jiǎn)化了身份驗(yàn)證和工具管理。
這種多層方法至關(guān)重要,因?yàn)樗梢詽M足不同開(kāi)發(fā)者的需求?;A(chǔ)設(shè)施團(tuán)隊(duì)可以直接針對(duì)MCP等協(xié)議進(jìn)行構(gòu)建,而應(yīng)用程序開(kāi)發(fā)人員可以利用Composio或Arcade.dev等托管解決方案。這些方法并不相互排斥。相反,它們可以共存并相互補(bǔ)充,最終加速采用Agent驅(qū)動(dòng)的應(yīng)用程序。
如今,找到部署Agent的工具仍然經(jīng)常依賴于口口相傳,感覺(jué)就像早期發(fā)現(xiàn)Discord服務(wù)器一樣。但標(biāo)準(zhǔn)化協(xié)議和托管集成層的結(jié)合,表明我們正在走向更結(jié)構(gòu)化的發(fā)現(xiàn)機(jī)制。
數(shù)據(jù)層:大規(guī)模內(nèi)存
數(shù)據(jù)層說(shuō)明了傳統(tǒng)基礎(chǔ)設(shè)施必須如何發(fā)展以適應(yīng)Agent的工作負(fù)載。Neon的經(jīng)驗(yàn)具有啟發(fā)意義。如上所述,AI代理現(xiàn)在以人類開(kāi)發(fā)人員4倍的速度創(chuàng)建Neon數(shù)據(jù)庫(kù),推動(dòng)了即時(shí)配置、自動(dòng)擴(kuò)展和隔離環(huán)境的新要求。
當(dāng)Create.xyz在Neon上推出其開(kāi)發(fā)人員Agent時(shí),Create最終在短短36小時(shí)內(nèi)創(chuàng)建了20,000個(gè)新數(shù)據(jù)庫(kù)。最終用戶只需描述他們想要構(gòu)建的內(nèi)容-“構(gòu)建一個(gè)使用AI對(duì)應(yīng)用程序進(jìn)行排名的職位板”或“創(chuàng)建一個(gè)自動(dòng)生成 SEO 元數(shù)據(jù)的內(nèi)容管理系統(tǒng)”-代理就會(huì)自動(dòng)處理所有數(shù)據(jù)庫(kù)操作。
數(shù)據(jù)層已細(xì)分為不同的組件,每個(gè)組件都具有獨(dú)特的功能。內(nèi)存系統(tǒng)(例如Mem0和Zep)提供特定于Agent的上下文,確保Agent可以保留和調(diào)用相關(guān)信息。存儲(chǔ)解決方案(包括Neon等傳統(tǒng)數(shù)據(jù)庫(kù)和 Pinecone等矢量數(shù)據(jù)庫(kù))正在不斷發(fā)展,以滿足Agent工作負(fù)載的需求。
同時(shí),ETL服務(wù)正在興起以處理非結(jié)構(gòu)化數(shù)據(jù),從而實(shí)現(xiàn)Agent驅(qū)動(dòng)系統(tǒng)中更高效的數(shù)據(jù)轉(zhuǎn)換和集成。
編排:管理Agent復(fù)雜性
隨著應(yīng)用程序整合多個(gè)協(xié)同工作的Agent,編排變得至關(guān)重要。托管編排解決方案(如LangGraph、CrewAI和Letta)使開(kāi)發(fā)人員能夠編寫(xiě)和管理協(xié)同工作的多個(gè)Agent,從而簡(jiǎn)化復(fù)雜的工作流程并增強(qiáng)協(xié)調(diào)性。
作為這些編排工具的補(bǔ)充,Inngest、Hatchet和Temporal等持久性引擎解決了在長(zhǎng)期運(yùn)行的Agent進(jìn)程中維護(hù)狀態(tài)的挑戰(zhàn),確保了連續(xù)性和可靠性。
03 展望未來(lái):Agent生態(tài)初具規(guī)模
一年前,我們把很多Agent開(kāi)發(fā)者所做的事,稱為“飛速穿越一座半成品橋”。如今,這座橋已經(jīng)越來(lái)越接近完工,交通量呈指數(shù)級(jí)增長(zhǎng),且還在增加新的車道。
人工智能Agent基礎(chǔ)設(shè)施的快速發(fā)展反映了軟件構(gòu)建方式的根本性轉(zhuǎn)變。我們看到的不僅僅是令人瞠目結(jié)舌的增長(zhǎng)指標(biāo)。我們正在見(jiàn)證一種新的軟件開(kāi)發(fā)范式的出現(xiàn)。
而隨著基礎(chǔ)設(shè)施堆棧越來(lái)越成熟,這個(gè)時(shí)刻也在加速到來(lái)。從MCP等標(biāo)準(zhǔn)化協(xié)議到身份驗(yàn)證、內(nèi)存和編排的專用服務(wù),我們看到了定義下一代應(yīng)用程序模式的出現(xiàn)。然而,創(chuàng)新的速度意味著我們?nèi)蕴幱谶@一轉(zhuǎn)型的早期階段。
本文由人人都是產(chǎn)品經(jīng)理作者【烏鴉智能說(shuō)】,微信公眾號(hào):【烏鴉智能說(shuō)】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!