2024CES-深度剖析AIGC與智能硬件結(jié)合的趨勢|Rabbit-R1 & AI-Pin & TAB-AI
隨著AI技術(shù)的進(jìn)步和時間的推移,AI與人類生活的融合度也在不斷提升,許多融合了AI的智能硬件,也以多樣的形態(tài)出現(xiàn)在我們面前。這篇文章里,作者從產(chǎn)品設(shè)計理念、產(chǎn)品能力,以及產(chǎn)品交互形態(tài)等維度拆解了3款消費(fèi)級AI設(shè)備,一起來看看吧。
見字如面~
文章內(nèi)容相較于視頻內(nèi)容會更加精簡
如需了解更多細(xì)節(jié)的內(nèi)容請觀看視頻,視頻地址:https://www.bilibili.com/video/BV1w6421V7k5
引言
一年一度的全球消費(fèi)電子風(fēng)向標(biāo)CES 2024已經(jīng)落下帷幕,展會中展示了很多科技向善的產(chǎn)品。
有專為視障人士設(shè)計的導(dǎo)盲眼鏡(lumen glasses),能夠感知周圍障礙物、路標(biāo)等物體,再通過聲音和觸覺反饋指引盲人行動。
有輔助步行鍛煉的穿戴設(shè)備WIM,用戶穿戴后可以減少20%的步行能量,適用于肌肉力量不足的老年人。
還有在展會中呼聲很高的手持設(shè)備,Rabbit-R1。
AI在以各種各樣的方式融入我們的生活,也從相對專業(yè)的領(lǐng)域,逐步向C端消費(fèi)市場中落地,文章會以三款消費(fèi)級AI設(shè)備為切入點(diǎn):Rabbit-R1、AI PIN、Tab AI。
從產(chǎn)品設(shè)計理念、產(chǎn)品能力,以及產(chǎn)品交互形態(tài)等幾方面,向你介紹生成式人工智能與可穿戴設(shè)備的融合趨勢,希望能夠給你帶來啟發(fā)與幫助。
一、Rabbit-R1
這款產(chǎn)品由華人創(chuàng)始人呂騁所創(chuàng)建,Rabbit-R1絕對是CES展會中的亮點(diǎn)產(chǎn)品之一。首批 1 萬臺迅速賣光,短短5天時間已經(jīng)賣了50000多臺,一臺售價199美元,在預(yù)售階段已經(jīng)獲利近1000萬美元。
1. 產(chǎn)品設(shè)計理念
Rabbit-R1的核心設(shè)計理念是“讓用戶告別繁瑣的應(yīng)用操作”。
怎么理解呢?好比我們需要訂一張旅游機(jī)票,有了它無需在應(yīng)用程序中自己摸索操作,而是通過語音的方式,給設(shè)備傳達(dá)指定,通過LLMs了解意圖,再將意圖轉(zhuǎn)化為LAM(大動作模型)的指令,從而自動完成應(yīng)用程序中的所有操作,并將結(jié)果呈現(xiàn)給用戶進(jìn)行選擇。
2. 硬件方面
R2abbit-R1通體呈亮橙色,其重量約為115克,正面有一塊2.88英寸的觸摸顯示屏。
屏幕右側(cè)上方,是一個能夠360° 旋轉(zhuǎn)的AI攝像頭,能夠執(zhí)行視覺類的任務(wù),如:物體識別、圖像分析。
攝像頭下面是操作滾輪,通過滑動滾輪或屏幕,可瀏覽屏幕中呈現(xiàn)的內(nèi)容。
側(cè)邊有一個圓形按鍵,是一鍵喚醒AI的快捷鍵。
3. 信息呈現(xiàn)及交互方式
在硬件方面,通過語音交互和拍攝的方式進(jìn)行信息輸入,信息的輸出以屏幕顯示和語音的方式進(jìn)行呈現(xiàn),交互上通過滑動滾輪或屏幕瀏覽信息。
4. 軟件方面
Rabbit-R1的操作系統(tǒng)叫做 Rabbit OS,其核心在于操作系統(tǒng)中搭載了「大動作模型」(Large Action Model)。
簡單的說LAM能夠?qū)W習(xí)人們操作應(yīng)用程序(APP)的行為,能夠基于文本指令,實(shí)現(xiàn)應(yīng)用程序內(nèi)的操作步驟,從而完成任務(wù)目標(biāo)。
與LLM的區(qū)別在于,LLM-大語言模型學(xué)習(xí)的是文本語料,從而理解文本語意,生成文本內(nèi)容。
LAM大動作模型學(xué)習(xí)的是人們操作應(yīng)用程序的行為路徑,可基于指令完成應(yīng)用程序操作。
我們接著來看第二款產(chǎn)品。
二、AI-PIN
AI Pin是初創(chuàng)公司Humane的首個產(chǎn)品,兩位創(chuàng)始人均為蘋果的前員工。
它是一款可以吸附在衣服上的智能設(shè)備,沒有屏幕,設(shè)備中搭載語音裝置和投影儀,可以通過語音、手勢、觸控等形式與設(shè)備進(jìn)行交互。
產(chǎn)品的基礎(chǔ)定價為699美元,外加24美元的月訂閱服務(wù)費(fèi)。
其中訂閱服務(wù)費(fèi)的核心服務(wù)包括:T-Mobile電話號碼和網(wǎng)絡(luò)服務(wù)、照片/視頻/文件的云存儲服務(wù)以及GPT4的無限調(diào)用次數(shù)。
1. 產(chǎn)品設(shè)計理念
其目標(biāo)是減少用戶對智能機(jī)的依賴,以全新的、無屏幕、可對話的形式,賦予用戶隨時隨地使用AI的能力。
簡單的說就是想干掉智能手機(jī),邁入穿戴設(shè)備的iPhone時刻。
2. 硬件方面
AI Pin由兩部分組成:設(shè)備和電池,設(shè)備與電池之間可通過磁性吸附在衣服上,產(chǎn)品總量為54克,相當(dāng)于一個雞蛋的重量。
設(shè)備的頂部方搭載了麥克風(fēng)/揚(yáng)聲器,能夠進(jìn)行音頻播放,作為語音信息輸入的關(guān)鍵配件。
設(shè)備的上方搭載了廣角攝像頭能夠進(jìn)行拍照、攝影。作為AI信息輸入的“眼睛”,能夠識別和分析現(xiàn)實(shí)中的商品或檢測食品的營養(yǎng)成分。
在攝像頭的旁邊裝在了激光投影儀,可將數(shù)字信息投影在手掌上,從而實(shí)現(xiàn)數(shù)字信息的展示與交互。
抬起手掌即可喚醒投影裝置;
通過手掌側(cè)移,手指捏合可以實(shí)現(xiàn)數(shù)據(jù)信息的交互。
設(shè)備的下方為觸控板區(qū)域,能夠通過手指實(shí)現(xiàn)觸控交互,如單指點(diǎn)擊并按住,可以和AI進(jìn)行交流;雙指雙擊可進(jìn)行拍攝,滑動可控制音頻的音量等等。
3. 軟件方面
AI PIN操作系統(tǒng)名為Cosmos。
它支持實(shí)時訪問GPT4,不僅可以對輸入的信息(語音或圖像)進(jìn)行處理,也能通過AI幫助我們總結(jié)和搜索重要信息,比如:語音輸入特定指令:Catch me up 后,AI會將我們?nèi)粘V匾畔⑦M(jìn)行摘要匯總,也能通過語音指令,讓AI檢索信息后,直接告訴我們信息內(nèi)容。
AI PIN提供了個人信息的管理中心,名為:Humane.center。
在Humane.center中,用戶可管理自己的數(shù)據(jù),包括照片、視頻、筆記、郵件、短信等,隨著這些信息不斷的豐富,AI會更懂用戶,成為真正的個人助理。
AI PIN這款產(chǎn)品的出現(xiàn),無論在外觀的工業(yè)設(shè)計、人機(jī)交互方式,還是與生成式人工智能的結(jié)合上,都為可穿戴人工智能設(shè)備開辟了一條新道路。但是這款產(chǎn)品本身也做不到替代智能手機(jī)。
主要分享兩個個人觀點(diǎn):
第一,該產(chǎn)品的使用場景受限,語音交互作為AI PIN的主要交互形式,在相對嘈雜環(huán)境中會影響信息輸入的準(zhǔn)確性、在相對安靜的環(huán)境中,對于I人來說不好意思開口,不適合在公共場所中使用。其次投影+手勢交互形式,雖然形式很新穎,但在手掌投屏,其清晰度、可見度和內(nèi)容展示的豐富度,都不如顯示屏。
第二,雖然AI PIN自建了COSMOS操作系統(tǒng)~~,并且能夠讓用戶在Humane.center中管理和上傳與自己相關(guān)的數(shù)據(jù)~~,但該系統(tǒng)不支持接入第三方應(yīng)用程序APP,所以無法構(gòu)建生態(tài)應(yīng)用,導(dǎo)致在智能手機(jī)中的數(shù)據(jù)遷移成本過高。
三、TAB-AI
Tab AI由一位名叫Avi Schiffmann的哈佛大學(xué)生開發(fā)。
它是一款可穿戴的AI項(xiàng)鏈,目前的產(chǎn)品樣式是一個圓形的裝置,內(nèi)置通過麥克風(fēng)、藍(lán)牙和電池,可持續(xù)運(yùn)行 30 小時、全天候、不間斷地記錄周圍的對話。
1. 產(chǎn)品設(shè)計理念
AVI在做這款產(chǎn)品時,他認(rèn)為穿戴設(shè)備只是作為一個附屬物,最好是讓使用者幾乎感覺不到它的存在,所以硬件設(shè)備只需要能夠持續(xù)運(yùn)行、隨時可用即可,無需有復(fù)雜交互方式。
2. 硬件方面
在產(chǎn)品的硬件設(shè)計上,最重要的三個硬件裝置就是麥克風(fēng)、藍(lán)牙和電池,項(xiàng)鏈僅僅作為語音信息收集端,將音頻收集后,傳到軟件系統(tǒng)中,進(jìn)行音頻轉(zhuǎn)文字的處理,處理后的文字內(nèi)容存儲在云端服務(wù)器中。
一方面作為AI的知識庫,可以被AI調(diào)用,讓AI更懂用戶。
另一方面,可以將文本傳給大模型進(jìn)行內(nèi)容分析,比如個人的情感分析 或者 心理健康狀態(tài)分析等等。
3. 軟件方面
用戶通過在手機(jī)應(yīng)用程序的中與AI進(jìn)行交流,交互的方式類似于移動端的ChatGPT,支持語音和文本的輸入,支持多輪溝通。
所以Tab AI通過獲取用戶日常的語音數(shù)據(jù),了解了用戶整個生活背景的上下文,能夠輸出專屬于我的內(nèi)容。
我們沿著這個基礎(chǔ)上做更近一步的假設(shè)。
除了在搜集音頻外,Tab AI若能夠近一步的做出行為規(guī)劃,那將是一件更酷的事情。
比如一場會議結(jié)束后,AI通過搜集到的音頻內(nèi)容,自動生成會議紀(jì)要以及待辦事情。
再比如我們?nèi)粘=涣饔^點(diǎn)時,AI能夠獲取我過往的思考,并與當(dāng)前討論內(nèi)容進(jìn)行結(jié)合,從而幫助我們形成知識的連接。每一個富有創(chuàng)新的想法時,就是在一次又一次的思維碰撞與連接中產(chǎn)生的。
結(jié)尾
好啦~咱們分別介紹三款消費(fèi)級AI設(shè)備:Rabbit-R1、AI PIN、Tab AI
你更喜歡哪一款呢?
隨著時間的推移,AI必將成為我們?nèi)粘I钪械暮献骰锇?、助理、甚至是懂你的朋友,它可能以具身機(jī)器人的形態(tài)出現(xiàn),也可能以日常穿戴配件的方式融入我們的生活,無論以什么形式,我們都將迎來一個更加智能、便捷、高效的美好生活。
感謝你的觀看,咱們下期再見。
作者:在野在也,公眾號:在野在也
本文由 @在野在也 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!