AI瀏覽器插件,到底誰(shuí)才是打工人的新質(zhì)生產(chǎn)力(Kimi與豆包完整版體驗(yàn)報(bào)告)

0 評(píng)論 4700 瀏覽 8 收藏 16 分鐘

近日,月之暗面官宣上線(xiàn)Kimi瀏覽器插件,官方介紹稱(chēng),該插件支持輕量搜索功能,適用于瀏覽網(wǎng)頁(yè)術(shù)語(yǔ)查詢(xún)、報(bào)道文章摘要總結(jié)、寫(xiě)作靈感提供、文檔數(shù)據(jù)查詢(xún)等應(yīng)用場(chǎng)景。插件目前功能較少,但都為大模型常用場(chǎng)景,包括“點(diǎn)文筆”和“總結(jié)器”兩項(xiàng)功能。那么kimi與豆包的瀏覽器插件功能上線(xiàn)后到底誰(shuí)更勝一籌,通過(guò)這篇文章作者帶大家一探究竟。

一、插件是什么?

相較于傳統(tǒng)的應(yīng)用開(kāi)發(fā)流程,插件無(wú)需開(kāi)發(fā)一整套完整系統(tǒng),通過(guò)接口就能提供服務(wù),且易于修改和更新。在某種意義上,插件是AI應(yīng)用創(chuàng)新的最佳載體。

kimi瀏覽器插件的下載地址:https://kimi.moonshot.cn/extension/download

豆包瀏覽器插件的下載地址:https://www.doubao.com/browser-extension/landing?utm_source=web_signed

二、豆包與Kimi的特點(diǎn)與差異化

通過(guò)安裝教程知道豆包與Kimi的瀏覽器插件都是crx文件直接拖動(dòng)至chrom即可安裝成功。

豆包與Kimi自己回答本身的插件功能如下

1. 豆包

  • 逐行翻譯:直接在原文旁查看翻譯,能夠清晰對(duì)比。
  • 快速摘要和亮點(diǎn)生成:可以一鍵從網(wǎng)頁(yè)、PDF 和圖片中總結(jié)并生成亮點(diǎn)。
  • AI 輔助搜索結(jié)果:使用豆包進(jìn)行搜索,并利用偏好的搜索引擎生成搜索摘要。
  • 創(chuàng)意寫(xiě)作助手:直接撰寫(xiě)周報(bào)日?qǐng)?bào)、朋友圈、小紅書(shū)、微博等內(nèi)容。
  • 側(cè)邊欄面板:點(diǎn)擊豆包的浮窗菜單按鈕可打開(kāi)側(cè)邊欄面板,自動(dòng)根據(jù)當(dāng)前頁(yè)面進(jìn)行對(duì)話(huà)。
  • 頭像浮窗菜單按鈕:提供常用功能,如翻譯此網(wǎng)頁(yè),可沉浸式翻譯當(dāng)前網(wǎng)頁(yè)內(nèi)容;總結(jié)此網(wǎng)頁(yè),可在側(cè)邊欄總結(jié)當(dāng)前網(wǎng)頁(yè)內(nèi)容。
  • AI 劃詞工具欄:不僅集成了 AI 搜索、解釋、翻譯和復(fù)制等實(shí)用快捷工具,還允許用戶(hù)對(duì)劃詞工具欄的外觀進(jìn)行個(gè)性化定制,甚至能自定義工具欄技能。用戶(hù)可進(jìn)入設(shè)置頁(yè)面調(diào)整外觀樣式,也可添加新技能,每個(gè)技能本質(zhì)上是一個(gè)小 Bot,在提示詞內(nèi)容中支持變量 selection 表示當(dāng)前劃詞的文字內(nèi)容,以便更靈活地定制技能。
  • 豆包搜索摘要卡:在搜索頁(yè)面中展示搜索摘要卡,不僅能快速搜索總結(jié),還可向豆包繼續(xù)提問(wèn),并在聊天中繼續(xù)對(duì)話(huà),改變以往的搜索體驗(yàn)。點(diǎn)擊“在聊天中繼續(xù)”按鈕后,會(huì)直接進(jìn)入側(cè)邊欄面板繼續(xù)對(duì)話(huà)。
  • 智能語(yǔ)法檢查:當(dāng)在網(wǎng)頁(yè)輸入文本出現(xiàn)語(yǔ)法錯(cuò)誤時(shí),及時(shí)提醒并提供修改建議。
  • 語(yǔ)音朗讀:劃詞工具欄的“翻譯”和“總結(jié)”功能支持語(yǔ)音朗讀。
  • 在線(xiàn)視頻總結(jié)和對(duì)話(huà):支持對(duì)在線(xiàn)視頻進(jìn)行總結(jié)和對(duì)話(huà),例如 B 站的視頻右邊會(huì)顯示“總結(jié)視頻”的入口,總結(jié)完成后可在右側(cè)展示“總結(jié)內(nèi)容”和“視頻亮點(diǎn)”,點(diǎn)擊每個(gè)亮點(diǎn)內(nèi)容可自動(dòng)定位到視頻具體位置,也可點(diǎn)擊總結(jié)內(nèi)容底部的“在聊天中繼續(xù)”與視頻進(jìn)行對(duì)話(huà)。

2. Kimi

  • 多語(yǔ)言對(duì)話(huà)能力:能夠流暢地進(jìn)行中文和英文對(duì)話(huà)。
  • 長(zhǎng)文本處理:支持最多20萬(wàn)字的輸入和輸出,可以處理長(zhǎng)文本寫(xiě)作、翻譯、代碼編寫(xiě)等任務(wù)。
  • 文件閱讀和解析:能夠閱讀和解析TXT、PDF、Word文檔、PPT幻燈片、Excel電子表格等格式的文件。
  • 網(wǎng)頁(yè)內(nèi)容解析:當(dāng)用戶(hù)發(fā)送網(wǎng)頁(yè)鏈接時(shí),我會(huì)先解析網(wǎng)頁(yè)內(nèi)容,然后結(jié)合解析內(nèi)容回答用戶(hù)問(wèn)題。
  • 搜索能力:結(jié)合搜索結(jié)果為用戶(hù)提供更全面的回答。
  • 角色扮演:根據(jù)用戶(hù)要求,可以進(jìn)行角色扮演對(duì)話(huà)。
  • 代碼輸出:對(duì)于代碼相關(guān)問(wèn)題,我會(huì)提供完整的可執(zhí)行代碼。
  • 文檔和文件生成:雖然不能直接創(chuàng)建文件,但可以提供文字回復(fù)幫助用戶(hù)解決問(wèn)題。
  • 付費(fèi)打賞支持:用戶(hù)可以通過(guò)網(wǎng)頁(yè)端付費(fèi)打賞支持Kimi。
  • Kimi+功能:允許用戶(hù)根據(jù)特定需求自定義Kimi模型。
  • 網(wǎng)頁(yè)和App使用引導(dǎo):提供Kimi智能助手的網(wǎng)頁(yè)和App下載鏈接。
  • 語(yǔ)音輸入輸出支持:最新版Kimi智能助手App支持語(yǔ)音輸入和輸出。

從豆包和kimi的大模型插件回答中,可以看出豆包回答的實(shí)際功能還是比較準(zhǔn)確的,kimi回答的12個(gè)功能中,其中有5條是不符合瀏覽器插件功能的只有通過(guò)訪(fǎng)問(wèn)官網(wǎng)才會(huì)有,從語(yǔ)意理解上豆包的回答會(huì)更準(zhǔn)確一些。

基于插件功能的基礎(chǔ)上我們接下來(lái)進(jìn)行幾個(gè)維度的體驗(yàn)分析

3、基礎(chǔ)功能拆解

對(duì)豆包與kimi的瀏覽器插件基礎(chǔ)功能進(jìn)行拆解

經(jīng)過(guò)基礎(chǔ)的功能拆解后通過(guò)對(duì)比,豆包的基礎(chǔ)能力要比kimi豐富很多,在插件的展示邏輯上豆包只能通過(guò)側(cè)邊欄進(jìn)行輔助工作,kimi可以通過(guò)快捷鍵進(jìn)行全局懸浮,從交互體驗(yàn)上kimi在處理基礎(chǔ)文本工作上體驗(yàn)會(huì)更友好一些。

豆包大模型瀏覽器插件如下圖,基礎(chǔ)功能上支持圖像生成;AI搜索;翻譯等,這一點(diǎn)要遠(yuǎn)比kimi支持的業(yè)務(wù)場(chǎng)景更多元,在交互體驗(yàn)與更多功能中,豆包支持劃詞工具欄簡(jiǎn)化與技能庫(kù),這是Kimi不具備的,技能庫(kù)這一功能可以重點(diǎn)展開(kāi)講一下,對(duì)于小紅書(shū)創(chuàng)作的博主與代碼極客來(lái)說(shuō)實(shí)在是太爽了,可以無(wú)縫銜接通過(guò)懸浮窗進(jìn)行文案修改與代碼糾錯(cuò),這兩點(diǎn)在后續(xù)的業(yè)務(wù)場(chǎng)景中會(huì)詳細(xì)展開(kāi)來(lái)說(shuō)。

三、適用的業(yè)務(wù)場(chǎng)景

結(jié)合白領(lǐng)工作模擬3類(lèi)業(yè)務(wù)大模型推理場(chǎng)景,分析豆包與kimi的推理能力

1. 競(jìng)品分析

TOB產(chǎn)品經(jīng)理在日常工作中需要經(jīng)常對(duì)于競(jìng)品網(wǎng)站的業(yè)務(wù)邏輯與覆蓋板塊進(jìn)行邏輯梳理與分析,下面以用友、泛微、攜程商旅三個(gè)TOB網(wǎng)站為測(cè)試樣本測(cè)試Kimi與豆包大模型插件的邏輯推理能力。

kimi與豆包表現(xiàn):

觀點(diǎn)1:通過(guò)3個(gè)TOB的高級(jí)網(wǎng)站業(yè)務(wù)框架分析kimi與豆包的推理能力,從token的推理數(shù)量與網(wǎng)站邏輯分析上來(lái)看kimi 與豆包打平,但是kimi可以用【回車(chē)】按鈕直接進(jìn)行全文總結(jié)推理,交互上kimi更勝一籌。

2. 簡(jiǎn)歷分析

在文件處理工作中LLM模型應(yīng)用最為廣泛以簡(jiǎn)歷附件處理為背景測(cè)試kimi與豆包的大模型插件在瀏覽器中的實(shí)用性,當(dāng)在chrom瀏覽器中打開(kāi)一份簡(jiǎn)歷附件時(shí),kimi與豆包的插件懸浮按鈕是不支持彈出的,需要手動(dòng)打開(kāi)插件側(cè)邊欄進(jìn)行輔助工作,但這一功能只有豆包有效,Kimi是無(wú)效的。

在瀏覽器側(cè)邊欄跟豆包進(jìn)行交互時(shí),邏輯卻不是耦合的在pdf文件上進(jìn)行劃詞時(shí),無(wú)法激活豆包的劃詞技能庫(kù),只有在側(cè)邊欄單獨(dú)進(jìn)行附件傳輸與問(wèn)答時(shí)才有作用。

觀點(diǎn)2:在關(guān)聯(lián)固定瀏覽器打開(kāi)的pdf文件時(shí),Kimi還需進(jìn)行適配激活優(yōu)化,豆包需要進(jìn)行耦合邏輯與激活劃詞技能庫(kù)優(yōu)化

3. 文案創(chuàng)作與文章閱讀

當(dāng)日常我們?cè)陂喿x公眾號(hào)文章或小紅書(shū)博主在進(jìn)行文案腳本創(chuàng)作時(shí),kimi與豆包的大模型插件可以在瀏覽器中幫助進(jìn)行大幅提效;

當(dāng)選取的文字沒(méi)有上下文做支撐時(shí),Kimi 需要在文本框輸入文字搜索;而豆包得益于更好的 UI 界面,直接點(diǎn)擊搜索便在側(cè)邊欄得到詳盡答案。

當(dāng)有足夠的上下文支撐時(shí),Kimi 表現(xiàn)亮眼,不僅能給出細(xì)致解釋?zhuān)材芙Y(jié)合上下文進(jìn)一步幫助用戶(hù)理解詞匯和文章。

對(duì)于一篇題為“股權(quán)融資活動(dòng)與歐洲價(jià)值增長(zhǎng)回報(bào)”的英文文章,豆包能夠正確總結(jié)網(wǎng)站并給予 6 個(gè)點(diǎn)的亮點(diǎn)提煉;Kimi 插件也能準(zhǔn)確總結(jié)文章,并對(duì)關(guān)鍵段落進(jìn)行總結(jié)提煉亮點(diǎn),且能夠?qū)?shù)據(jù)、重要定義以及關(guān)鍵行為進(jìn)行解釋?zhuān)淇偨Y(jié)更加全面并且深入。

豆包得益于更好的 UI 界面與劃詞技能庫(kù),這一點(diǎn)對(duì)于新媒體作者的靈感非常有幫助,以小紅書(shū)腳本為例豆包插件可以直接通過(guò)劃詞技能庫(kù)直接生成小紅書(shū)文案。

觀點(diǎn)3:在輔助閱讀時(shí),Kimi插件不僅總結(jié)內(nèi)容,還能對(duì)數(shù)據(jù)、重要定義以及關(guān)鍵行為進(jìn)行解釋?zhuān)黾涌偨Y(jié)的深度且全局懸浮的交互效果好大幅提高文章閱讀效率;豆包的UI界面和劃詞技能庫(kù)設(shè)計(jì)對(duì)新媒體作者特別有用,內(nèi)容創(chuàng)作方面的實(shí)用性上更勝一籌。

四、當(dāng)下與未來(lái)的生態(tài)擴(kuò)展思考

1. 當(dāng)下問(wèn)題優(yōu)化

1)提升交互體驗(yàn)

  • 即時(shí)反饋:進(jìn)一步優(yōu)化Kimi的即時(shí)反饋機(jī)制,如通過(guò)語(yǔ)音或更直觀的界面提示,增強(qiáng)用戶(hù)的交互體驗(yàn)
  • 多模態(tài)交互:探索將視覺(jué)、觸覺(jué)等多模態(tài)交互方式融入插件,提升用戶(hù)體驗(yàn)。

2)增強(qiáng)文件處理能力

  • 跨平臺(tái)適配:加強(qiáng)Kimi和豆包在不同操作系統(tǒng)和瀏覽器中的文件處理能力,確保其在各種環(huán)境下的穩(wěn)定性和兼容性。
  • 智能預(yù)處理:開(kāi)發(fā)智能預(yù)處理功能,自動(dòng)調(diào)整文件格式和內(nèi)容,以適應(yīng)不同的閱讀和分析需求。

3)深化內(nèi)容理解與創(chuàng)作輔助

  • 深度學(xué)習(xí)與自然語(yǔ)言處理:利用深度學(xué)習(xí)技術(shù)提升對(duì)數(shù)據(jù)、定義和行為的理解和解釋能力,使總結(jié)更加精準(zhǔn)和深入。
  • 創(chuàng)意生成工具:為豆包開(kāi)發(fā)更高級(jí)的創(chuàng)意生成工具,幫助新媒體作者在內(nèi)容創(chuàng)作中實(shí)現(xiàn)更多創(chuàng)新和個(gè)性化表達(dá)。

2. 未來(lái)生態(tài)擴(kuò)展

當(dāng)前豆包與kimi只是開(kāi)發(fā)了適配于瀏覽器的插件進(jìn)行工作提效,想要獲得的更大的市場(chǎng)份額和利益生態(tài)擴(kuò)展是必然;

但是在當(dāng)前大模型市場(chǎng)與互聯(lián)網(wǎng)行業(yè)的軟件生態(tài)的存量市場(chǎng)競(jìng)爭(zhēng)中,市場(chǎng)份額很高的現(xiàn)象級(jí)軟件,不論是TOB/TOC領(lǐng)域都已巨頭林立;

豆包背靠母公司字節(jié)在抖音,西瓜視頻,今日頭條,激萌等一眾APP產(chǎn)品線(xiàn)的扶持下市場(chǎng)份額不必有太多擔(dān)心,在APP工廠(chǎng)下自然會(huì)有C端來(lái)不斷的補(bǔ)齊研發(fā)成本,拉高ROI;

但是對(duì)于kimi這種創(chuàng)業(yè)團(tuán)隊(duì)來(lái)說(shuō)想要與巨頭已經(jīng)完成閉環(huán)的生態(tài)中競(jìng)爭(zhēng),進(jìn)行產(chǎn)業(yè)融合的落地是唯一的不二選擇

例如:

  • 教育與研究場(chǎng)景:將大模型插件應(yīng)用于教育和研究領(lǐng)域,輔助學(xué)術(shù)研究和知識(shí)傳播。
  • 企業(yè)解決方案場(chǎng)景:開(kāi)發(fā)面向企業(yè)的定制化解決方案,幫助企業(yè)在數(shù)據(jù)分析、市場(chǎng)研究等方面提升效率。
  • 數(shù)據(jù)安全:加強(qiáng)數(shù)據(jù)加密和隱私保護(hù)措施,確保用戶(hù)在使用插件時(shí)的數(shù)據(jù)安全。
  • 合規(guī)性:確保插件符合各國(guó)的數(shù)據(jù)保護(hù)法規(guī),增強(qiáng)用戶(hù)對(duì)產(chǎn)品的信任。

但是只卷TOB/TOG領(lǐng)域?qū)τ诳萍籍a(chǎn)業(yè)資本來(lái)講市場(chǎng)還是小的,而且抗周期與抗風(fēng)險(xiǎn)性較差,還需要與數(shù)10億的C端消費(fèi)者共享企業(yè)利潤(rùn)才可以達(dá)成完美的閉環(huán);

例如最近爆火的蘿卜快跑,科技是服務(wù)于人民的;人工智能更多的應(yīng)用場(chǎng)景值得科技資本進(jìn)一步的探索。

專(zhuān)欄作家

小于愛(ài)學(xué)習(xí),公眾號(hào):產(chǎn)品技術(shù)加油站,人人都是產(chǎn)品經(jīng)理專(zhuān)欄作家。左手科技互聯(lián)網(wǎng)&右手產(chǎn)業(yè)與經(jīng)濟(jì),長(zhǎng)期關(guān)注硬科技和產(chǎn)業(yè)經(jīng)濟(jì)學(xué)。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!
专题
60912人已学习12篇文章
业务流程图是最常见的图表之一,能看懂读懂是必修课,能绘制便是非常重要的选修课。
专题
11683人已学习12篇文章
对着互联网行业的不断发展,如今很多传统行业都与互联网想结合,医药行业也不例外。本文作者分享了关于互联网医疗的运营知识。
专题
18128人已学习15篇文章
语音交互是基于语音输入的新一代交互模式,通过说话就可以得到反馈结果。本专题的文章分享了语音交互的入门指南。
专题
12157人已学习14篇文章
随着科技的发展,AI技术渗透进各个行业里边,AI图像生成和识别技术有了更大的突破性,本专题的文章分享了AI图像识别。
专题
11652人已学习12篇文章
2023年双十一逐渐临近,各个电商平台也摩拳擦掌开始准备。本专题的文章分享了双十一营销玩法。
专题
19742人已学习13篇文章
本专题的文章分享了产品经理面试题和解答思路。