KIMI視覺(jué)思考模型到底強(qiáng)不強(qiáng)?公開(kāi)3輪真實(shí)體驗(yàn)和分析
在人工智能技術(shù)的不斷進(jìn)步中,Kimi的視覺(jué)思考模型K1以其獨(dú)特的能力吸引了眾多關(guān)注。本文將帶您深入了解K1模型的實(shí)際體驗(yàn),通過(guò)三輪真實(shí)的測(cè)試視頻和細(xì)致的分析,我們將探索K1在解決復(fù)雜問(wèn)題、解讀圖表和識(shí)別圖片內(nèi)容等方面的強(qiáng)大功能。
Kimi的視覺(jué)思考模型 K1已經(jīng)發(fā)布有幾天了,有很多的測(cè)評(píng)和贊美。到底強(qiáng)不強(qiáng),需要自己去體驗(yàn)一下才行。
今天就體驗(yàn)和測(cè)評(píng)一下Kimi的這款新能力。
一、入口
進(jìn)入KimiPC官網(wǎng),在首頁(yè) – 搜索框下,有一個(gè)快捷入口。
【Kimi k1 視覺(jué)思考模型搶先體驗(yàn)】
二、對(duì)話體驗(yàn)界面
中間是對(duì)話區(qū)域和3個(gè)提示問(wèn)題,如下;
- 接下來(lái)我會(huì)發(fā)你截圖,幫我解答圖中的題目好嗎?
- 接下來(lái)我會(huì)發(fā)你一張復(fù)雜圖表,請(qǐng)你幫我逐步解讀?
- 接下來(lái)我會(huì)發(fā)你食物照片,收到后幫我逐步計(jì)算卡路里?
看似默認(rèn)的預(yù)設(shè)問(wèn)題,分別暗示了Kimi的K1思考模型的3個(gè)能力層面。
- 解答數(shù)學(xué)題,很難很難的那種。
- 解讀復(fù)雜的圖表,類(lèi)似于財(cái)報(bào),包含了柱狀圖、餅圖、曲線圖、還有表格等各種復(fù)雜內(nèi)容、數(shù)字、符號(hào)的圖表文檔等。
- 圖片實(shí)體內(nèi)容識(shí)別,并解讀實(shí)體背后的核心邏輯,展現(xiàn)驚人的圖片識(shí)別和分析能力。
三、Kimi+的名片體驗(yàn)
還有右邊的Kimi+的名片,作為產(chǎn)品經(jīng)理,也是要好好研究一下的,值得玩味。
Kimi 視覺(jué)思考版
每個(gè)像素,都值得深入思考。基于 k1 視覺(jué)思考模型 | 來(lái)自 Kimi
文檔解讀很強(qiáng)大。
支持的文件格式:PDF、Word 文檔(DOC、DOCX)、Excel 表格(XLSX)、PPT(PPT、PPTX)、TXT、CSV、MD。
四、測(cè)試素材準(zhǔn)備
為了順利測(cè)試Kimi的這幾個(gè)方面的能力,我準(zhǔn)備了3張不同的圖片,如下:
第一張:超高難度奧數(shù)題
第二張:電動(dòng)汽車(chē)充電市場(chǎng)展望分析圖
第三張:用AI生成的一盤(pán)實(shí)物圖片
五、Kimi視覺(jué)思考模型解奧數(shù)題
體驗(yàn)過(guò)程,我已經(jīng)把體驗(yàn)的過(guò)程錄制成了視頻,請(qǐng)觀看,可獲得更直觀的感受。
體驗(yàn)過(guò)程中的幾點(diǎn)感受:
優(yōu)點(diǎn):
- 預(yù)設(shè)好的問(wèn)題,埋好了prompt,上傳并發(fā)送相關(guān)圖片,即可得到想要的答復(fù),體驗(yàn)很好。
- 響應(yīng)速度很快,很好,基本不用等待。
- 輸出的過(guò)程非常詳細(xì),這道題很難,我?guī)缀跏强床欢?,Kimi思考了完整的詳細(xì)的過(guò)程,并連續(xù)輸出了4分鐘,1共59行推理過(guò)程,包含文字、數(shù)字、和公式。
如果哪位數(shù)學(xué)大牛懂這道題,可以詳細(xì)看看Kimi的解答過(guò)程是否合理。從多個(gè)其他大模型做這道題的過(guò)程借結(jié)果來(lái)看,我感覺(jué)Kimi的功底還是挺深的。
缺點(diǎn):
1、不管是PC端還是APP端,都存在前端公式渲染效果的問(wèn)題,如下圖:
六、Kimi視覺(jué)思考模型解讀圖表
體驗(yàn)過(guò)程:
數(shù)據(jù)錯(cuò)誤:
ABB:從6.6下降到0.9,下降幅度非常顯著。
結(jié)論也稍有問(wèn)題:
這一部分的下降幅度更為顯著,尤其是ABB,其市銷(xiāo)率從6.6驟降至0.9。這可能表明這些公司在盈利能力和市場(chǎng)預(yù)期方面面臨更大的挑戰(zhàn)。
七、Kimi視覺(jué)思考模型計(jì)算圖中食物卡路里
體驗(yàn)過(guò)程,我已經(jīng)把體驗(yàn)的過(guò)程錄制成了視頻,請(qǐng)觀看,可獲得更直觀的感受。
Kimi的回答,第一步:
識(shí)別圖片中的食物,按照主次、大小的一般邏輯描述圖中的食物。
第二步:按照識(shí)別到的食物,逐一計(jì)算卡路里。
計(jì)算方式:
1、設(shè)定食物類(lèi)型
2、該種食物單位熱量計(jì)算
3、估算圖中該種食物的分量
4、計(jì)算圖中該種食物的熱量值
第三步:所有食物熱量相加,得出總熱量值
第四步:自我反思,重新評(píng)估,反復(fù)確認(rèn)
以上就是體驗(yàn)的基本情況。
當(dāng)然還有更多場(chǎng)景沒(méi)有覆蓋,有興趣的伙伴也可以自己去試試。
還可以給一些潦草的筆記,讓Kimi識(shí)別后進(jìn)行思考輸出,很有意思。
利用這幾點(diǎn)能力,可以幫解決工作和生活中的一些問(wèn)題。
本文由人人都是產(chǎn)品經(jīng)理作者【Echo 產(chǎn)品論】,微信公眾號(hào):【產(chǎn)品經(jīng)理的邏輯與審美】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Kimi官網(wǎng)截圖
- 目前還沒(méi)評(píng)論,等你發(fā)揮!