OpenAI,Google和阿里們都“認”了的MCP,究竟給開發(fā)者帶來啥實惠了
近期,Google DeepMind和OpenAI等巨頭紛紛宣布支持由Anthropic主導的模型上下文協(xié)議(MCP),這一舉動引發(fā)了行業(yè)內(nèi)的廣泛關注。MCP旨在成為AI Agent時代的開放標準,為AI模型與外部數(shù)據(jù)源和工具之間的交互提供標準化的解決方案。本文將深入探討MCP的核心價值、實際應用場景以及它為開發(fā)者帶來的具體好處,幫助讀者理解這一新興標準如何推動AI技術的發(fā)展和應用。
AI領域的互操作性標準之爭正變得異常熱鬧。
就在本周,Google DeepMind CEO Demis Hassabis宣布,將為其Gemini模型添加對Anthropic主導的模型上下文協(xié)議MCP的支持,稱其為“一個優(yōu)秀的協(xié)議,正迅速成為 AI Agent 時代的開放標準”。
這距離OpenAI CEO Sam Altman宣布支持MCP僅僅過去幾周時間。
幾乎在同一時間段,Google Cloud也高調(diào)推出了自己主導的、旨在實現(xiàn)AI Agent之間協(xié)作和工作流自動化的開放協(xié)議——Agent2Agent (A2A),并聯(lián)合了包括Salesforce、Box等在內(nèi)的 50 多家技術伙伴。
這種看似“左右互搏”的舉動——既擁抱競爭對手的標準,又力推自家的新協(xié)議,恰恰凸顯了當前行業(yè)對于如何讓AI模型、Agent更有效地連接外部數(shù)據(jù)、工具乃至彼此協(xié)作的迫切需求與探索。盡管A2A的目標是Agent間的通信與協(xié)作,Google對MCP的明確支持,仍然被視為MCP走向主流標準的一個強力信號。
那么,這個讓巨頭們投入關注,并且已經(jīng)在實際應用中嶄露頭角的MCP,其核心價值究竟是什么?它能為開發(fā)者和用戶帶來哪些實實在在的好處?
01 AI的“通用連接器”
MCP 最初由 Anthropic 提出并開源,旨在創(chuàng)建一個開放、標準的規(guī)范,讓大型語言模型能夠無縫地與各種外部數(shù)據(jù)源和工具(如業(yè)務軟件、數(shù)據(jù)庫、代碼庫等)進行交互??梢詫⑵湎胂鬄锳I世界的“USB-C”或“通用翻譯器”,解決模型智能與現(xiàn)實應用之間的連接問題。
在Anthropic的推動下,尤其是在OpenAI和Google這兩大巨頭相繼明確表態(tài)支持后,MCP正從一個有潛力的提議,加速成為被廣泛接受的標準。這標志著AI應用開發(fā)朝著更統(tǒng)一、更高效的方向邁出了重要一步。國內(nèi)如阿里云百煉等平臺也已迅速跟進,上線MCP功能并著手構(gòu)建服務生態(tài)。
MCP的核心價值在于“標準化”。它定義了一套通用規(guī)范,允許任何AI模型(客戶端)通過輕量級的“MCP服務器”與外部資源交互。這解決了以往需要為每個模型和工具定制集成方案的碎片化問題,MCP借鑒了API、LSP等協(xié)議標準化的成功經(jīng)驗。雖然技術本身非顛覆性,但其標準化的嘗試對提升開發(fā)效率和拓寬應用場景潛力巨大。
02 MCP到底有什么用?
那么MCP的實際價值體現(xiàn)在何處?關鍵在于其模型無關的通用性、可重用性和組合性,這使得AI能夠在真實場景中發(fā)揮更大作用。
首先,MCP有效打通了AI與外部數(shù)據(jù)和工具的壁壘。有了MCP,AI能直接與數(shù)據(jù)庫對話,用自然語言查詢實時的銷售數(shù)據(jù);或者連接到你的代碼倉庫,像一個真正的助手那樣瀏覽、理解甚至修改代碼。同樣,通過接入Slack、Google Drive等日常生產(chǎn)力工具的MCP服務器,AI可以幫你收發(fā)消息、查找更新文檔,無縫融入你的工作流程。
MCP的更大的潛力在于驅(qū)動更復雜的Agent行為和跨服務協(xié)作。AI Agent不再局限于執(zhí)行單一任務,而是能組合調(diào)用多個MCP服務器來完成復雜目標。
必優(yōu)科技近期發(fā)布了AI PPT方向的MCP Server,市場負責人張嘉蒙給硅星人舉了一個例子:要生成一份介紹北京交通的PPT,AI可以先調(diào)用地圖服務商(如高德)的MCP獲取交通數(shù)據(jù),再調(diào)用PPT制作工具(比如必優(yōu)自己的服務)的MCP來整合信息并生成演示文稿。這種跨服務的便捷調(diào)度,尤其是讓不同開發(fā)者提供的服務能被AI靈活組合,在過去是難以想象的,MCP則有望打破這種壁壘?!俺R?guī)我是調(diào)不到高德接口的,因為他們沒空理我們,MCP至少讓我們的門檻降低了”。
Codeium是最早集成 MCP的開發(fā)者工具公司之一。在他們的 IDE產(chǎn)品Windsurf中引入了MCP 支持,使AI能夠執(zhí)行各種開發(fā)任務,而不僅僅是代碼補全。Codeium 的付費用戶可以通過 GUI 或配置文件配置外部 MCP 服務器,Codeium 用戶可以連接一個文件系統(tǒng)或 Git MCP 服務器,以便 AI 代理可以瀏覽和修改項目文件。 Codeium團隊指出,Windsurf 現(xiàn)在能夠讓用戶自己選擇MCP 服務器,以使用定制工具和服務。這種擴展性極大地增強了 AI 在 IDE 中的能力—-AI 不再局限于靜態(tài)代碼,而是能夠與外部 API 交互、運行測試命令或通過網(wǎng)絡搜索查詢文檔。
此外,像LangChain這樣的開源代理框架已開始整合MCP。已有工具發(fā)布,可將MCP工具轉(zhuǎn)換為適用于Python或TypeScript代理的LangChain工具,這意味著使用LangChain規(guī)劃的現(xiàn)有代理可以像調(diào)用本地函數(shù)一樣調(diào)用MCP服務器。這些表明,MCP正在吸引那些希望其AI代理具備廣泛功能而不必從頭編寫每個集成的開發(fā)者。
另一個更生動的一個例子來自一位自稱代碼小白的開發(fā)者“瑪格麗特加鹽”,他利用Cherry Studio平臺,接入Gemini模型,并參考官方文檔自建了一個MCP服務器,該服務器集成了搜索API(包含谷歌地圖、航班、酒店工具)。通過這種方式打造了一個個性化的旅行助手。在測試中,當詢問“新加坡機場到景點的公共交通路線”時,AI通過MCP調(diào)用了谷歌地圖工具,給出了比通用AI(如豆包)更具體、準確且附帶地圖截圖的路線規(guī)劃。在處理更復雜的“規(guī)劃杭州到新加坡行程(含機票酒店推薦)”任務時,AI更是展現(xiàn)了按需依次調(diào)用時間、航班、酒店搜索等多個MCP工具的能力,實現(xiàn)了多步驟規(guī)劃,其結(jié)果的可用性也顯著優(yōu)于通用AI的簡單聯(lián)網(wǎng)搜索。
當我們對比MCP與特定模型的內(nèi)置功能(如Function Calling)時可以看到,MCP不局限于某個模型意味著為一個工具構(gòu)建的MCP服務器,可以被任何支持MCP協(xié)議的AI客戶端復用,極大地促進了工具生態(tài)的繁榮,因此被形象地稱為“AI領域的ODBC”。當然,這種靈活性也可能帶來額外的部署開銷和初期技術門檻。
目前,MCP也存在著一些局限性。例如開發(fā)者“多多”在嘗試使用Claude + Blender MCP進行3D建模時發(fā)現(xiàn)的,雖然MCP能讓AI執(zhí)行一些Blender的簡單操作,但在從零創(chuàng)建復雜模型或精確修改特定部位時效果不佳,AI難以精確理解3D空間的細節(jié)。她的經(jīng)驗表明,現(xiàn)階段MCP在某些專業(yè)領域的深度應用,可能更適合輔助專業(yè)用戶加速簡單操作,或在已有模型基礎上進行粗略調(diào)整,而非完全替代傳統(tǒng)流程。
也就是說,要發(fā)揮MCP的價值,不僅依賴協(xié)議本身,更依賴于MCP服務器的具體能力以及AI模型對任務和工具的理解程度,其在特定領域的成熟仍需時日。
MCP并非完美無缺,傳統(tǒng)API在某些場景下仍有其價值。當前其應用尚處早期,但跨模型兼容性和標準化的優(yōu)勢正吸引著越來越多的參與者。
從目前趨勢看,隨著行業(yè)主要玩家的采納、相關生態(tài)的逐步建立以及更多實際應用的探索,MCP很可能成為AI與現(xiàn)有軟件和服務集成的基礎技術。我們可能會看到更多產(chǎn)品“自帶”MCP接口,讓軟件天生具備“AI就緒”能力。這就像瀏覽器擴展API改變了網(wǎng)頁交互一樣,MCP正在為AI模型提供一套標準化的方式,與現(xiàn)實世界的數(shù)字工具進行協(xié)作。MCP有潛力成為提升AI在具體業(yè)務場景中實用性的關鍵基礎設施,促進AI與現(xiàn)有軟件和工作流程更緊密的融合。
作者|周一笑
本文由人人都是產(chǎn)品經(jīng)理作者【硅星人】,微信公眾號:【硅星人Pro】,原創(chuàng)/授權 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!