又黑又紅的Manus,還要闖三道關(guān)
本文將深入剖析Manus的“黑紅”體質(zhì),探討其背后的技術(shù)邏輯、用戶體驗(yàn)以及面臨的成本、技術(shù)和市場(chǎng)競(jìng)爭(zhēng)三大挑戰(zhàn),試圖還原一個(gè)真實(shí)的Manus,并思考其對(duì)國(guó)內(nèi)AI Agent發(fā)展的啟示。
“AI一天,人間一年”。
3月6日凌晨,Manus亮相,瞬間點(diǎn)燃了整個(gè)科技圈。它被稱為全球首款通用型AI Agent(人工智能代理)產(chǎn)品,由國(guó)內(nèi)一家創(chuàng)業(yè)團(tuán)隊(duì)——Monica.im打造。但這場(chǎng)技術(shù)狂歡,迅速陷入爭(zhēng)議旋渦。發(fā)布僅兩天,Manus的口碑經(jīng)歷了數(shù)次劇烈反轉(zhuǎn)。
Manus官方將自己定義為一款連接思維與行動(dòng)的通用人工智能代理,特點(diǎn)是擅長(zhǎng)處理各種任務(wù),不僅能思考(聽(tīng)懂復(fù)雜指令進(jìn)行推理),還能交付成果(順滑對(duì)接完成該任務(wù)的各個(gè)環(huán)節(jié),將最終結(jié)果給到用戶)。
舉個(gè)簡(jiǎn)單的例子。
如果讓Manus篩選簡(jiǎn)歷,用戶只需將存有多份簡(jiǎn)歷的壓縮包直接發(fā)給Manus,剩下的任務(wù)就全部交由它完成。Manus會(huì)自動(dòng)解壓縮文件,瀏覽找出重要信息,給出候選人評(píng)估結(jié)果,還可以將候選人姓名和重要信息做成表格,方便用戶查閱。
在此過(guò)程中,用戶不僅可以關(guān)閉電腦,還能隨時(shí)添加其他任務(wù)。
有了Manus,普通HR的日常工作似乎變得“多余”。這也讓許多人驚呼,取代打工人的“AI牛馬”真的來(lái)了。
不過(guò),Manus屬于“黑紅”體質(zhì)。
發(fā)布之初,它被冠以“炸裂”、“拳打ChatGPT”、“比肩DeepSeek”、“震撼硅谷”等名頭,風(fēng)光無(wú)限。不久后質(zhì)疑聲接踵而至,有人認(rèn)為它過(guò)度營(yíng)銷,技術(shù)沒(méi)有太大突破實(shí)為“套殼”,噱頭遠(yuǎn)大于實(shí)際能力。
緊接著,其內(nèi)測(cè)邀請(qǐng)碼被炒到10萬(wàn)元天價(jià)的消息傳出;它在X平臺(tái)上的官方賬號(hào)被凍結(jié),顯示原因?yàn)椤斑`反平臺(tái)規(guī)則”。隨后,Manus聯(lián)合創(chuàng)始人兼首席科學(xué)家季逸超公開(kāi)回應(yīng)稱,賬號(hào)被凍結(jié)可能與第三方提及加密貨幣詐騙有關(guān),該領(lǐng)域與Manus的運(yùn)營(yíng)完全無(wú)關(guān)。
這一系列事件,更加深了外界對(duì)Manus的疑慮。這款備受矚目的產(chǎn)品,究竟是真正的技術(shù)革新,還是營(yíng)銷噱頭?未來(lái)又能火多久?
01 爭(zhēng)議中的Manus,真有實(shí)力還是套殼工具?
Manus爆火兩天,外界對(duì)它的評(píng)價(jià)極為兩極分化。
一部分人覺(jué)得Manus讓AI Agent又上了一個(gè)臺(tái)階,馬上就要搶走打工人的飯碗,也有一部分人認(rèn)為它只是個(gè)套殼工具。
來(lái)看它“封神”的點(diǎn)。
相比市面上已經(jīng)出現(xiàn)AI Agent(比如豆包、文小言都內(nèi)置了很多智能體),Manus的優(yōu)點(diǎn)之一在于,處理復(fù)雜任務(wù)時(shí)具備自主性、連續(xù)性。
比如用戶只需給出一段比較詳細(xì)的提示詞,Manus便能自主解讀、拆解并給出結(jié)果,還能進(jìn)行自我檢查,省去了一步步的對(duì)話引導(dǎo)步驟。
由于Manus是基于云端異步運(yùn)行,用戶下達(dá)完指令后關(guān)閉頁(yè)面都不會(huì)影響Manus處理指令,任務(wù)完成后還會(huì)自動(dòng)通知用戶結(jié)果。
Manus的另一大亮點(diǎn),是號(hào)稱全球首款通用型AI Agent產(chǎn)品。
需要注意的是“通用”二字,指它能夠處理各種各樣的任務(wù),不限任何領(lǐng)域,比如支持篩選簡(jiǎn)歷、房產(chǎn)調(diào)研、股票分析等多場(chǎng)景。
然而,對(duì)于這兩大亮點(diǎn),也存在著不少質(zhì)疑的聲音。
首先,由于Manus處于內(nèi)測(cè)階段,采用邀請(qǐng)碼制度,大多數(shù)用戶尚未真正使用過(guò)該產(chǎn)品,目前對(duì)其“驚艷”的評(píng)價(jià)大多源自官方發(fā)布的演示視頻。鑒于過(guò)往許多AI產(chǎn)品都存在“樣片水平大于實(shí)際實(shí)力”的情況,部分從業(yè)者認(rèn)為Manus的真實(shí)能力有待進(jìn)一步考量。
其次,對(duì)于Manus的“通用性”,部分從業(yè)者認(rèn)為,存在套殼嫌疑。
有從業(yè)者評(píng)價(jià),Manus沒(méi)有自研底層大模型的能力,其模型能力主要來(lái)源于國(guó)外Anthropic的Claude。而且,很多場(chǎng)景和功能早已在其他Agent中實(shí)現(xiàn)。比如,Devin作為全球首個(gè)AI程序員,也是一個(gè)能獨(dú)立完成寫代碼任務(wù)(學(xué)習(xí)新技術(shù)、調(diào)試代碼到部署應(yīng)用程序)的AI Agent,在去年年底便面向公眾開(kāi)放。
從這個(gè)角度來(lái)看,Manus更像是給現(xiàn)有的各類AI應(yīng)用加了個(gè)殼子,把DeepResearch(OpenAI推出)、Computer Use(Anthropic推出)等應(yīng)用匯總了起來(lái)。
AI軟件工程師覃相告訴「定焦One」,Manus是基于現(xiàn)有大語(yǔ)言模型的調(diào)用,并未涉及底層技術(shù)突破。比如在進(jìn)行股票分析時(shí),Manus通過(guò)調(diào)用雅虎金融API獲取數(shù)據(jù),再借助編程語(yǔ)言生成可視化圖表,依賴的都是現(xiàn)有的技術(shù)和工具。
參加了Manus閉門分享會(huì)的AI博主自動(dòng)華也對(duì)「定焦One」表示,制作團(tuán)隊(duì)分享了Manus作為AI員工主要做的三件事:配電腦(賦予AI訪問(wèn)瀏覽器和工具的能力)、配權(quán)限(接入私有API和權(quán)威數(shù)據(jù)源)、給培訓(xùn)(用戶可以通過(guò)反饋實(shí)時(shí)調(diào)整AI行為)。
可見(jiàn),Manus本質(zhì)上是將各種工具進(jìn)行拼接,其能完成跨應(yīng)用這類復(fù)雜任務(wù),依賴的是Claude模型,以及接入的各類智能體工具。
至于“套殼”“拼接”是否算作創(chuàng)新,業(yè)界觀點(diǎn)不一。支持者認(rèn)為,這種整合方式能夠快速實(shí)現(xiàn)多種功能,為用戶提供一站式解決方案,具有一定的實(shí)用價(jià)值;反對(duì)者則認(rèn)為,這種模式只是基于現(xiàn)有技術(shù)進(jìn)行簡(jiǎn)單組合。
但從業(yè)者基本都認(rèn)同,從技術(shù)維度上看,Manus還遠(yuǎn)稱不上是下一個(gè)DeepSeek。
02 如何正確看待Manus?
比起技術(shù),Manus走紅的關(guān)鍵在于用戶體驗(yàn)。
減少了操作步驟,執(zhí)行過(guò)程中不用反復(fù)和AI對(duì)話,還可以關(guān)閉界面,這都是過(guò)往AI Agent產(chǎn)品所不具備的。
自動(dòng)華認(rèn)為,AI Agent的意義在于幫助普通人提效,Manus重新定義了AI應(yīng)用的價(jià)值指標(biāo),由重視DAU(用戶留存)變到AHPU(Agentic Hours Per User,用戶使用AI完成任務(wù)所耗費(fèi)的時(shí)間)。
“正是這樣的benchmark(可簡(jiǎn)單理解為評(píng)估指標(biāo)),決定了產(chǎn)品優(yōu)化路線,讓Manus和市面上其他AI Agent產(chǎn)品有了區(qū)別?!弊詣?dòng)華表示。
他解釋,傳統(tǒng)互聯(lián)網(wǎng)產(chǎn)品都是“注意力經(jīng)濟(jì)”,希望占據(jù)用戶更多的使用時(shí)間,最終通過(guò)廣告變現(xiàn),所以將五花八門的垂類Agent放到了產(chǎn)品中。
Manus的定位是通用型AI Agent,在執(zhí)行同量任務(wù)情況時(shí),試圖讓用戶花的時(shí)間越短越好,所以它做了一個(gè)大整合,希望用越快的操作方式、越少的操作步驟為用戶提效。
這與團(tuán)隊(duì)的過(guò)往背景有關(guān)。Manus背后的團(tuán)隊(duì)在2023年開(kāi)發(fā)了AI瀏覽器插件助手Monica,他們發(fā)現(xiàn)瀏覽器作為單用戶場(chǎng)景存在人機(jī)控制權(quán)沖突,AI頻繁打斷用戶體驗(yàn)的痛點(diǎn),由此得出“AI應(yīng)擁有獨(dú)立云端瀏覽器”。
自動(dòng)華覺(jué)得,正是由此他們提出了“Less structure, more intelligence”,主張減少對(duì)AI的結(jié)構(gòu)化限制,依賴模型自主進(jìn)化能力,而非人工預(yù)設(shè)流程,才讓Manus區(qū)別于傳統(tǒng) AI Agent。
這也是大部分用戶對(duì)Manus感到興奮的點(diǎn)。覃相將Manus比作“數(shù)字代理人”,能自動(dòng)拆解復(fù)雜指令、替用戶完成多個(gè)任務(wù),而且執(zhí)行速度快,在任務(wù)執(zhí)行和用戶體驗(yàn)上超越了豆包和百度的AI Agent。
覃相還進(jìn)一步分析Manus核心優(yōu)勢(shì)背后的技術(shù)原理:多代理架構(gòu)、強(qiáng)自主學(xué)習(xí)能力。
首先,Manus具備多代理架構(gòu)與任務(wù)分解能力,它采用了多智能體系統(tǒng)架構(gòu),能夠?qū)?fù)雜任務(wù)分解為多個(gè)子任務(wù),并通過(guò)不同的智能體協(xié)同完成。這種架構(gòu)使其能夠高效處理長(zhǎng)尾任務(wù)。
其次,它具備自主學(xué)習(xí)與記憶功能,能夠記住用戶的偏好,并在后續(xù)任務(wù)中主動(dòng)調(diào)整策略。這種自主學(xué)習(xí)能力使其能夠不斷優(yōu)化任務(wù)執(zhí)行邏輯,逐漸從被動(dòng)響應(yīng)轉(zhuǎn)向主動(dòng)服務(wù)。
不過(guò),在速度提升時(shí),準(zhǔn)確率也是需要重點(diǎn)考慮的要素。
Manus官方指出其具有低錯(cuò)誤率,在GAIA(一個(gè)專為通用人工智能助手設(shè)計(jì)的基準(zhǔn)數(shù)據(jù)集,主要用來(lái)評(píng)估 AI的基本能力)中,面對(duì)基礎(chǔ)(整理文件、數(shù)據(jù)分析)、中等(調(diào)用API、寫代碼)、復(fù)雜(邏輯推理、多模態(tài)處理)三個(gè)級(jí)別的任務(wù)測(cè)試,其分?jǐn)?shù)都超過(guò)了OpenAI的DeepResearch,但低于人類平均正確率92%,仍不如人腦聰明。
正如前文所說(shuō),由于產(chǎn)品還未大范圍鋪開(kāi),從業(yè)者對(duì)其實(shí)際效果持懷疑態(tài)度。很多博主在測(cè)評(píng)中發(fā)現(xiàn),Manus在處理中等復(fù)雜的任務(wù)時(shí),出現(xiàn)了長(zhǎng)耗時(shí)問(wèn)題;在訪問(wèn)需要登錄的網(wǎng)站或處理付費(fèi)墻內(nèi)容時(shí),也會(huì)出現(xiàn)卡頓,還是需要用戶手動(dòng)接管。
03 Manus的下一步,成本、技術(shù)、市場(chǎng)競(jìng)爭(zhēng)
Manus的爭(zhēng)議不小,但被捧得很高。很多人擔(dān)心,Manus正式上線后,如果實(shí)力與預(yù)期不符,很有可能消耗掉DeepSeek為國(guó)內(nèi)AI積攢下來(lái)的正向價(jià)值。
自動(dòng)華告訴「定焦One」,在Manus的閉門分享會(huì)上,官方也提到了將面臨的一些問(wèn)題。比如未來(lái)的產(chǎn)品戰(zhàn)略會(huì)朝著優(yōu)化成本和提升運(yùn)行速度努力,同時(shí)他們也在尋找一個(gè)與成本相平衡的商業(yè)化定價(jià)模式,所以距離公開(kāi)上線還會(huì)有一段時(shí)間。
這些挑戰(zhàn)中,成本問(wèn)題尤為突出。
“Manus單任務(wù)運(yùn)行成本約2美元,雖然僅為競(jìng)品DeepResearch的1/10,但相比于豆包的單次任務(wù)調(diào)用回答,卻昂貴了非常多倍?!弊詣?dòng)華表示,在他看來(lái),Manus調(diào)用的算力和生成結(jié)果的質(zhì)量與競(jìng)品存在差異,但在目前國(guó)內(nèi)大模型產(chǎn)品普遍免費(fèi)的背景下,這種AI一次性完成高質(zhì)量結(jié)果對(duì)應(yīng)的付費(fèi)模式,還有待探索。
目前,大多數(shù)普通用戶為AI產(chǎn)品付費(fèi)的意愿較低,盡管是功能強(qiáng)大的AI軟件工程師Devin,高昂的月費(fèi)(500美元)導(dǎo)致使用它的人很少。
這也是Manus需要邀請(qǐng)碼才能使用的重要原因。從業(yè)者認(rèn)為,官方之所以不全面放開(kāi)使用權(quán)限,一方面可能是“饑餓營(yíng)銷”,但更重要的是,要考慮商業(yè)價(jià)值和成本的平衡。
用戶多了很有可能導(dǎo)致算力跟不上。“Manus的底層是依靠大模型能力,算力緊張可通過(guò)加顯卡解決,但很多公司支付不起背后高額的成本,特別是Monica還是一家創(chuàng)業(yè)公司?!弊詣?dòng)華表示,Kimi在剛推出市場(chǎng)時(shí)也遭遇過(guò)類似問(wèn)題,也沒(méi)有輕易選擇加顯卡。
其次,當(dāng)前AI Agent還做不到像人類一樣聰明,解決問(wèn)題的能力相對(duì)有限,Manus也同樣面臨著這一問(wèn)題。
比如,最容易出現(xiàn)的情況是對(duì)用戶問(wèn)題理解不清晰,同一個(gè)問(wèn)題反復(fù)問(wèn)AI Agent好幾遍,生成的答案還是無(wú)法達(dá)到與人類認(rèn)知相匹配的標(biāo)準(zhǔn)。
因?yàn)锳I Agent在執(zhí)行任務(wù)時(shí)的思考方式是,復(fù)現(xiàn)成熟的任務(wù)流程或通過(guò)訓(xùn)練數(shù)據(jù)對(duì)問(wèn)題進(jìn)行簡(jiǎn)單拆分,歸根究底,還是依賴于大模型的基礎(chǔ)能力。Manus并沒(méi)有在這方面做出強(qiáng)技術(shù)突破。有使用者指出,Manus對(duì)復(fù)雜問(wèn)題的拆解能力仍處于較低水平。
以及Manus即將面臨的市場(chǎng)競(jìng)爭(zhēng)壓力也不小。
覃相認(rèn)為,豆包和百度的AI Agent也有各自的市場(chǎng)定位和技術(shù)優(yōu)勢(shì),未來(lái)它們可能會(huì)通過(guò)技術(shù)升級(jí)或差異化競(jìng)爭(zhēng),縮小與Manus的差距,而且這兩家公司的資金實(shí)力更強(qiáng)。
對(duì)于Manus的火爆,很多人持觀望態(tài)度。不止一位投資人對(duì)「定焦One」表示,雖然他們很看好今年AI Agent的發(fā)展,但由于之前有類似AI程序員Devin的出現(xiàn),Manus并沒(méi)有太驚艷到他們,核心技術(shù)問(wèn)題也沒(méi)有得到根本性提升。
此刻,相比DeepSeek護(hù)城河較低的Manus,已經(jīng)有不少開(kāi)源復(fù)刻版項(xiàng)目出現(xiàn),留給Manus的時(shí)間不多了。
作者 | 王璐 編輯 | 魏佳
本文由人人都是產(chǎn)品經(jīng)理作者【定焦One】,微信公眾號(hào):【定焦One】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!