KIMI視覺(jué)思考模型到底強(qiáng)不強(qiáng)?公開(kāi)3輪真實(shí)體驗(yàn)和分析

0 評(píng)論 991 瀏覽 0 收藏 8 分鐘

在人工智能技術(shù)的不斷進(jìn)步中,Kimi的視覺(jué)思考模型K1以其獨(dú)特的能力吸引了眾多關(guān)注。本文將帶您深入了解K1模型的實(shí)際體驗(yàn),通過(guò)三輪真實(shí)的測(cè)試視頻和細(xì)致的分析,我們將探索K1在解決復(fù)雜問(wèn)題、解讀圖表和識(shí)別圖片內(nèi)容等方面的強(qiáng)大功能。

Kimi的視覺(jué)思考模型 K1已經(jīng)發(fā)布有幾天了,有很多的測(cè)評(píng)和贊美。到底強(qiáng)不強(qiáng),需要自己去體驗(yàn)一下才行。

今天就體驗(yàn)和測(cè)評(píng)一下Kimi的這款新能力。

一、入口

進(jìn)入KimiPC官網(wǎng),在首頁(yè) – 搜索框下,有一個(gè)快捷入口。

【Kimi k1 視覺(jué)思考模型搶先體驗(yàn)】

二、對(duì)話體驗(yàn)界面

中間是對(duì)話區(qū)域和3個(gè)提示問(wèn)題,如下;

  1. 接下來(lái)我會(huì)發(fā)你截圖,幫我解答圖中的題目好嗎?
  2. 接下來(lái)我會(huì)發(fā)你一張復(fù)雜圖表,請(qǐng)你幫我逐步解讀?
  3. 接下來(lái)我會(huì)發(fā)你食物照片,收到后幫我逐步計(jì)算卡路里?

看似默認(rèn)的預(yù)設(shè)問(wèn)題,分別暗示了Kimi的K1思考模型的3個(gè)能力層面。

  1. 解答數(shù)學(xué)題,很難很難的那種。
  2. 解讀復(fù)雜的圖表,類(lèi)似于財(cái)報(bào),包含了柱狀圖、餅圖、曲線圖、還有表格等各種復(fù)雜內(nèi)容、數(shù)字、符號(hào)的圖表文檔等。
  3. 圖片實(shí)體內(nèi)容識(shí)別,并解讀實(shí)體背后的核心邏輯,展現(xiàn)驚人的圖片識(shí)別和分析能力。

三、Kimi+的名片體驗(yàn)

還有右邊的Kimi+的名片,作為產(chǎn)品經(jīng)理,也是要好好研究一下的,值得玩味。

Kimi 視覺(jué)思考版

每個(gè)像素,都值得深入思考。基于 k1 視覺(jué)思考模型 | 來(lái)自 Kimi

文檔解讀很強(qiáng)大。

支持的文件格式:PDF、Word 文檔(DOC、DOCX)、Excel 表格(XLSX)、PPT(PPT、PPTX)、TXT、CSV、MD。

四、測(cè)試素材準(zhǔn)備

為了順利測(cè)試Kimi的這幾個(gè)方面的能力,我準(zhǔn)備了3張不同的圖片,如下:

第一張:超高難度奧數(shù)題

第二張:電動(dòng)汽車(chē)充電市場(chǎng)展望分析圖

第三張:用AI生成的一盤(pán)實(shí)物圖片

五、Kimi視覺(jué)思考模型解奧數(shù)題

體驗(yàn)過(guò)程,我已經(jīng)把體驗(yàn)的過(guò)程錄制成了視頻,請(qǐng)觀看,可獲得更直觀的感受。

體驗(yàn)過(guò)程中的幾點(diǎn)感受:

優(yōu)點(diǎn):

  1. 預(yù)設(shè)好的問(wèn)題,埋好了prompt,上傳并發(fā)送相關(guān)圖片,即可得到想要的答復(fù),體驗(yàn)很好。
  2. 響應(yīng)速度很快,很好,基本不用等待。
  3. 輸出的過(guò)程非常詳細(xì),這道題很難,我?guī)缀跏强床欢?,Kimi思考了完整的詳細(xì)的過(guò)程,并連續(xù)輸出了4分鐘,1共59行推理過(guò)程,包含文字、數(shù)字、和公式。

如果哪位數(shù)學(xué)大牛懂這道題,可以詳細(xì)看看Kimi的解答過(guò)程是否合理。從多個(gè)其他大模型做這道題的過(guò)程借結(jié)果來(lái)看,我感覺(jué)Kimi的功底還是挺深的。

缺點(diǎn):

1、不管是PC端還是APP端,都存在前端公式渲染效果的問(wèn)題,如下圖:

六、Kimi視覺(jué)思考模型解讀圖表

體驗(yàn)過(guò)程:

數(shù)據(jù)錯(cuò)誤:

ABB:從6.6下降到0.9,下降幅度非常顯著。

結(jié)論也稍有問(wèn)題:

這一部分的下降幅度更為顯著,尤其是ABB,其市銷(xiāo)率從6.6驟降至0.9。這可能表明這些公司在盈利能力和市場(chǎng)預(yù)期方面面臨更大的挑戰(zhàn)。

七、Kimi視覺(jué)思考模型計(jì)算圖中食物卡路里

體驗(yàn)過(guò)程,我已經(jīng)把體驗(yàn)的過(guò)程錄制成了視頻,請(qǐng)觀看,可獲得更直觀的感受。

Kimi的回答,第一步:

識(shí)別圖片中的食物,按照主次、大小的一般邏輯描述圖中的食物。

第二步:按照識(shí)別到的食物,逐一計(jì)算卡路里。

計(jì)算方式:

1、設(shè)定食物類(lèi)型

2、該種食物單位熱量計(jì)算

3、估算圖中該種食物的分量

4、計(jì)算圖中該種食物的熱量值

第三步:所有食物熱量相加,得出總熱量值

第四步:自我反思,重新評(píng)估,反復(fù)確認(rèn)

以上就是體驗(yàn)的基本情況。

當(dāng)然還有更多場(chǎng)景沒(méi)有覆蓋,有興趣的伙伴也可以自己去試試。

還可以給一些潦草的筆記,讓Kimi識(shí)別后進(jìn)行思考輸出,很有意思。

利用這幾點(diǎn)能力,可以幫解決工作和生活中的一些問(wèn)題。

本文由人人都是產(chǎn)品經(jīng)理作者【Echo 產(chǎn)品論】,微信公眾號(hào):【產(chǎn)品經(jīng)理的邏輯與審美】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Kimi官網(wǎng)截圖

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!