從沉思到執(zhí)行,AutoGLM 到底能否成為產(chǎn)品調(diào)研的好助手?

卜一定
0 評(píng)論 368 瀏覽 0 收藏 13 分鐘
🔗 产品经理的职业发展路径主要有四个方向:专业线、管理线、项目线和自主创业。管理线是指转向管理岗位,带一个团队..

在人工智能浪潮中,AutoGLM 作為一款備受矚目的產(chǎn)品,聲稱能實(shí)現(xiàn)“一邊想一邊干”的強(qiáng)大功能。然而,它是否真的能成為產(chǎn)品調(diào)研的好助手?本文作者通過親身實(shí)踐,從多個(gè)維度對(duì) AutoGLM 進(jìn)行了深度測(cè)試與分析,供大家參考。

媒體宣傳說智譜清言可以“一邊想一邊干”,于是我立刻申請(qǐng)內(nèi)測(cè),開始使用 AutoGLM,期盼它能自主運(yùn)行,幫我訂一杯奶茶。結(jié)果是它只是幫我打開了美團(tuán)網(wǎng)站,輸出了一堆沒用的信息,奶茶依然留在了奶茶店,沒有出現(xiàn)在我的桌面上。

我隨后又嘗試了官網(wǎng)宣傳的“訂酒店”功能,結(jié)果還是一長(zhǎng)串搜索與分析,最終也沒有真正幫我完成酒店預(yù)訂。

最終,我放棄了它“干”的功能,轉(zhuǎn)而測(cè)試它“想”的能力,嘗試用它來做一些深度分析。

從官網(wǎng)的用例來看,目前 AutoGLM 的核心功能,個(gè)人認(rèn)為還是集中在 Deep Research 層面。我下載了 mac 版本的桌面應(yīng)用,同時(shí)也下載了 Chrome 的 AutoGLM 插件。從插件的信息來看,支持自動(dòng)運(yùn)行的網(wǎng)站包括知乎、微博、百度等十幾個(gè)網(wǎng)站。正如官網(wǎng)所說,目前該產(chǎn)品功能仍處于實(shí)驗(yàn)階段,期待后續(xù)能夠真正實(shí)現(xiàn)“一句話訂酒店”的愿景。

我測(cè)試了一個(gè)“節(jié)假日西安周邊游”的出行規(guī)劃。從它的思維鏈可以看出,它的 workflow 包括:常規(guī)搜索、AutoGLM 搜索、工具調(diào)用、內(nèi)容思考、總結(jié)輸出。首次在小紅書上的搜索失敗,隨后改用搜索引擎進(jìn)行全局搜索。通過 tool observation 獲取信息,從知乎、小紅書、抖音等社交媒體進(jìn)行詳細(xì)搜索。

在搜索過程中,它會(huì)自動(dòng)啟動(dòng) Chrome 瀏覽器,可以看到 AutoGLM 的操作過程,比如調(diào)整小紅書搜索帖子的過濾器,從“綜合”調(diào)整為“最熱”。操作過程中,瀏覽器會(huì)出現(xiàn)藍(lán)色光暈閃現(xiàn),表示正在工作中。

大約 10 分鐘后輸出了一份行程規(guī)劃。但結(jié)果價(jià)值不大。因?yàn)槭枪?jié)假日,必然會(huì)遇到交通擁堵等問題,本應(yīng)提前規(guī)劃自駕路線,而報(bào)告中并未提供相應(yīng)的出行路線規(guī)劃。

官網(wǎng)介紹視頻講解了 AutoGLM 的技術(shù)路徑:從通用基座模型 GLM-4,到推理能力大幅提升的 GLM-Z1-Air,再到強(qiáng)化學(xué)習(xí)訓(xùn)練出“沉思”能力的 GLM-Z1-Rumination,最終融合為 AutoGLM 的執(zhí)行力。于是我開始橫向?qū)Ρ人摹俺了寄芰Α薄?/p>

這幾天我在研究 AI 在電子閱讀器中的應(yīng)用情況,于是隨手用 AI 來做一份產(chǎn)品市場(chǎng)分析,用類似 AutoGLM 的“沉思”功能來測(cè)試它的思考整合能力到底如何。

在 Mac 客戶端中輸入 Prompt:“分析目前電子閱讀器 AI 應(yīng)用的情況,從產(chǎn)品功能、定價(jià)策略、用戶評(píng)價(jià)、更新日志、社交媒體監(jiān)聽(受歡迎程度、用戶反饋以及互動(dòng)情況)、App Store / Google Play Store 數(shù)據(jù)分析(下載量、評(píng)分、評(píng)論內(nèi)容、更新頻率)等方面進(jìn)行調(diào)查,必須依據(jù)最新的數(shù)據(jù)進(jìn)行分析;另外分析未來 AI 在電子閱讀器領(lǐng)域的應(yīng)用趨勢(shì)?!?/p>

盡可能讓 Prompt 思考得更全面,并橫向?qū)Ρ绕渌?AI 模型的推理能力。

輸入 Prompt 后,客戶端開始工作,首先進(jìn)行免責(zé)申明,提示目前仍處于實(shí)驗(yàn)階段。隨后進(jìn)行常規(guī)搜索,第一步完成推理后,生成搜索關(guān)鍵詞。接著提示我確認(rèn)品牌,我補(bǔ)充輸入:“以亞馬遜等主流品牌為基礎(chǔ)研究,地區(qū)以歐美為主,中國(guó)為輔進(jìn)行分析?!盇utoGLM 再次搜索關(guān)鍵詞,并在推理與搜索過程中自動(dòng)啟動(dòng)了 Chrome,讓用戶實(shí)時(shí)看到其搜索流程。說實(shí)話,第一次看到它自動(dòng)彈出網(wǎng)頁(yè)并演示自動(dòng)搜索過程還挺新鮮,但如果一直這樣操作,就會(huì)影響用戶體驗(yàn)。在用戶進(jìn)行多任務(wù)工作時(shí),突然開啟大量網(wǎng)頁(yè),不僅無實(shí)際幫助,反而還需要用戶手動(dòng)關(guān)閉,增加負(fù)擔(dān)。

報(bào)告輸出后,內(nèi)容依然逃不過“大而全、泛泛而談”的通病,對(duì)我需要的信息闡述不夠細(xì)致,倒是展示了一堆額外信息。尤其是在數(shù)據(jù)范圍方面并未詳盡說明,比如價(jià)格和 Google Play Store 的數(shù)據(jù)分析基本缺失,提示無法獲取相關(guān)數(shù)據(jù)。我理解這可能是因?yàn)橹亲V的網(wǎng)絡(luò)環(huán)境限制了訪問 Google 網(wǎng)頁(yè)。

對(duì)比 ChatGPT-4o 的 Deep Research,它給的數(shù)據(jù)相對(duì)更“詳盡”,對(duì)數(shù)據(jù)的解讀也較為到位。用戶評(píng)論總結(jié)有據(jù)可依,關(guān)鍵結(jié)論都附有網(wǎng)頁(yè)鏈接,節(jié)省了二次搜索驗(yàn)證的精力。

而 Gemini 的 Deep Research 表現(xiàn)介于兩者之間,雖然提供了數(shù)據(jù)描述,但沒有像 ChatGPT 那樣結(jié)構(gòu)化地以表格形式清晰呈現(xiàn)。不過也提供了基本的數(shù)據(jù)與分析。從這個(gè)角度來看,ChatGPT 在這一項(xiàng)指標(biāo)上勝出。

再來看 Manus 的表現(xiàn),它同樣提供了數(shù)據(jù),并以結(jié)構(gòu)化的方式進(jìn)行了總結(jié)分析。對(duì)于常規(guī)研究,這些信息基本夠用。目前給出的分析細(xì)節(jié)與數(shù)據(jù)可信度略低于 ChatGPT。

AI 對(duì)現(xiàn)有數(shù)據(jù)的整合能力很強(qiáng),但對(duì)未來的預(yù)測(cè)仍然是基于現(xiàn)有數(shù)據(jù)的衍生與推演,我們也做了一些測(cè)試。

關(guān)于未來電子閱讀器 AI 的應(yīng)用分析,ChatGPT 給出了幾個(gè)方向:

1.閱讀器從“被動(dòng)呈現(xiàn)”轉(zhuǎn)向“主動(dòng)交互”。AI 可以成為閱讀伙伴,與讀者共同探討閱讀內(nèi)容。這是一個(gè)有趣的方向,但我個(gè)人認(rèn)為閱讀更偏向沉浸式體驗(yàn),頻繁交互可能反而影響體驗(yàn)。

2.AI 覆蓋整個(gè)閱讀流程,從“讀前-讀中-讀后”全流程滿足用戶細(xì)分需求。這對(duì)于產(chǎn)品設(shè)計(jì)初期是很好的創(chuàng)意來源。

3.更自然的語(yǔ)音交互。這項(xiàng)發(fā)展已經(jīng)非常接近現(xiàn)實(shí),可能會(huì)對(duì)有聲讀物市場(chǎng)產(chǎn)生一定沖擊。

4.推動(dòng)端側(cè)模型和云端模型的結(jié)合。類似手機(jī)產(chǎn)品,會(huì)有越來越多的 AI 功能通過端側(cè)模型處理,進(jìn)而推動(dòng)硬件處理器發(fā)展。

此外,還有一些總結(jié)性的風(fēng)險(xiǎn)提示。

AutoGLM 的“沉思”功能提供的方向相對(duì)概括:

1.個(gè)性化體驗(yàn)

2.深度理解

3.多模態(tài)交互

4.跨設(shè)備同步

5.社交閱讀

但整體分析偏簡(jiǎn)單,缺乏足夠細(xì)節(jié)來“令人信服”。感覺像是“為了 AI 而 AI”。這些總結(jié)點(diǎn)目前主流閱讀器已有實(shí)現(xiàn),沒有提出令人眼前一亮的新點(diǎn)子,顯得平庸。對(duì)產(chǎn)品設(shè)計(jì)前期的頭腦風(fēng)暴也沒能提供有力支持。

再來看 Gemini 提出的方向:

1.更智能的內(nèi)容推薦

2.更自然的交互方式

3.增強(qiáng)的語(yǔ)言學(xué)習(xí)功能

4.AI 驅(qū)動(dòng)的文本分析與理解

5.更強(qiáng)大的輔助功能

6.更互動(dòng)的動(dòng)態(tài)電子書

看完 Gemini 的分析,以及雖然沒有展示但已測(cè)試的 Manus,可以看出各家對(duì)未來的預(yù)測(cè)已趨同,本質(zhì)上并無太大差異。這說明,AI 能提供全面概括,但真正挖掘新的 AI 需求,仍需“以人為本”的體感洞察。

我們?cè)賮砜聪?Manus 的表現(xiàn),它同樣給出了數(shù)據(jù),并且以結(jié)構(gòu)化的進(jìn)行了總結(jié)分析,對(duì)于常規(guī)性的研究,這些信息基本夠用,目前給出的分析細(xì)節(jié)及數(shù)據(jù)可信度略低于 ChatGPT 。

綜合來看,AutoGLM、ChatGPT、Manus、Gemini 對(duì)產(chǎn)品調(diào)研確實(shí)有積極作用。在傳統(tǒng)桌面調(diào)研路徑中,AI 節(jié)省了大量時(shí)間和精力,能夠輕松獲取基礎(chǔ)產(chǎn)品信息。同時(shí),AI 的智能性也可扮演產(chǎn)品助理角色,補(bǔ)充我們的思路。但在涉及定性層面研究時(shí),仍需要“人肉”調(diào)研,真實(shí)使用產(chǎn)品、觀察用戶、聆聽用戶聲音,才能深入挖掘產(chǎn)品需求。

我認(rèn)為 AutoGLM 的優(yōu)勢(shì),最終還是應(yīng)聚焦在能夠 執(zhí)行用戶操作 的任務(wù)上,比如電子購(gòu)物、智能填表等。如果它能在執(zhí)行力方面做出差異化,才能在眾多思維鏈 AI 產(chǎn)品中脫穎而出。

本文由 @Antonio 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!
专题
36056人已学习30篇文章
大数据时代已经到来,越早进入,越有优势。
专题
13635人已学习13篇文章
本专题的文章分享了如何打造用户“上瘾”的产品。
专题
145774人已学习15篇文章
作为产品经理,你多多少少得懂点技术。
专题
18380人已学习13篇文章
AI产品经理的核心目的是通过AI技术创造和优化产品服务,丰富技术知识可以让自己在工作中拥有更多话语权。本专题的文章分享了AI产品经理需要掌握的AI技术。
专题
52371人已学习14篇文章
现在业内很多人都强调产品思维,但它到底是什么?又有何用武之地呢?
专题
31214人已学习16篇文章
在线教育的现状、趋势和未来。