AI 時(shí)代,人機(jī)交互即將消失?——新生篇(系列 3/3)
在 AI 時(shí)代浪潮的沖擊下,人機(jī)交互正經(jīng)歷著前所未有的變革。從腦機(jī)接口到空間計(jì)算,從多模態(tài)交互到情感化體驗(yàn),我們與機(jī)器的互動(dòng)方式正在被重新定義。本文深入探討了人機(jī)交互的未來趨勢(shì),提出了“人與智能體交互(Human-Agent Interaction, HAI)”這一全新概念,并通過蘋果、特斯拉等前沿科技的案例,展示了 HAI 如何在自然性、情感化、智能化和安全性上超越傳統(tǒng)的人機(jī)交互。
輔助駕駛讓我們可以節(jié)省更多的專注和注意力,個(gè)性化推薦通過越來越直白的方式告訴你想要什么。
我們漸漸發(fā)現(xiàn),周圍的交互正在發(fā)生明顯的變化。當(dāng)機(jī)器擁有了智能,已經(jīng)不單意味著純粹的算法集合,而是能主動(dòng)決策和執(zhí)行的“智能體(Agent)”。我們和智能體之間的交互和過去有什么不同,探索者們又在這個(gè)趨勢(shì)下,分享了什么實(shí)踐和思考?
本篇是本系列的最后一段旅程,新生的鐘聲悄然響起。我們將從多個(gè)維度探索未來的交互正在發(fā)生的變革,同時(shí)擁抱這些挑戰(zhàn)和機(jī)遇,一起找到這段旅程的最后一塊拼圖。
01 黎明前夕:交互趨勢(shì)變革進(jìn)行時(shí)
為了找到一個(gè)資料,我們往往需要頻繁拖著鼠標(biāo),敲著鍵盤,或者點(diǎn)擊滑動(dòng)屏幕,一步步完成任務(wù)。的確,這是我們當(dāng)下非常習(xí)慣,自然而然的交互方式,但當(dāng)新的技術(shù)和交互趨勢(shì)出現(xiàn)后,這種習(xí)慣還會(huì)保持多久?
“人們不知道他們想要什么,直到你把它擺在他們面前。”
—— 史蒂夫·喬布斯
更自然的方式
“人機(jī)命運(yùn)共同體”
“讓別人對(duì)我的大腦進(jìn)行手術(shù)并不是一個(gè)輕易的決定,但我相信利大于弊。”
30 歲的諾蘭德·阿博在 8 年前發(fā)生了一場(chǎng)嚴(yán)重的事故,肩以下的部位完全失去了知覺。2024 年 1 月,阿博毅然接受了Neuralink 的大腦芯片植入,開啟了人生的新篇章。這個(gè)技術(shù)將一枚硬幣大小的芯片植入到頭骨中,通過極細(xì)微的電極連接到大腦,實(shí)時(shí)捕捉并解碼他的神經(jīng)信號(hào),轉(zhuǎn)化為具體的交互操作。
聽起來很美好,實(shí)際怎么樣呢?這場(chǎng)“人機(jī)融合”表現(xiàn)出了意外的潛力。僅僅兩個(gè)月后,阿博現(xiàn)身在巴黎的大型國(guó)際象棋錦標(biāo)賽。和以前有點(diǎn)不一樣,阿博不再用口棒等傳統(tǒng)輔助設(shè)備來移動(dòng)鼠標(biāo),而是通過“意念”下棋。不僅如此,他還正在積極學(xué)習(xí)法語和日語,現(xiàn)在自己控制視頻進(jìn)度、寫寫作、聽聽播客都不在話下。這種生活質(zhì)量的顯著提升,讓阿博仿佛重拾了曾經(jīng)的活力與自由。
Noland Arbaugh(2024),世界上第一位接受 Neuralink 腦機(jī)接口植入物的人類受試者
我們作為交互主體,正在將身體的一部分功能慢慢地“委托”給機(jī)器,人機(jī)關(guān)系正在從單方面控制技術(shù),到人機(jī)的協(xié)同共生。當(dāng)然,不僅僅是自身發(fā)生了變化,這些機(jī)器本身也正在發(fā)生根本性的轉(zhuǎn)變。
空間即界面
《鋼鐵俠》中托尼·斯塔克隨手在空中劃拉幾下,就能在眼前浮現(xiàn)各種全息界面,這種方式一直以來都只存在于科幻電影,畢竟空氣要怎么承載界面?然而,在 2023 年 6 月的蘋果開發(fā)者大會(huì)上,庫(kù)克帶來的“One More Thing”——Vision Pro,似乎預(yù)示著這一美好圖景即將來臨了。
Vision Pro(2023)使用自然的手勢(shì)、眼神追蹤和語音命令作為主要的交互方式
Vision Pro 巧妙地將虛擬數(shù)字體驗(yàn)融入物理空間?,F(xiàn)實(shí)世界化身成為無限的畫卷,界面和數(shù)字信息如同流水般融入在我們周圍的環(huán)境,我們開始能在空間中用最自然的方式——手勢(shì)、語音、甚至用眼神進(jìn)行交互了。
想查看郵件?無需鼠標(biāo)鍵盤,只需在空中輕輕一抓。需要點(diǎn)擊旁邊的按鈕,眼睛一看,手指一捏合即可。想確認(rèn)尺寸?輕輕一點(diǎn),1:1 比例的家具栩栩如生地放置在面前。顯然,我們交互的設(shè)備載體不再僅僅依賴于固定尺寸的屏幕,而是朝著更加廣泛、無縫的物理環(huán)境躍遷。
在復(fù)雜中尋求簡(jiǎn)潔
2024 年的 Google I/O 大會(huì)視頻上,一位女性舉起智能手機(jī),對(duì)著攝像頭拍攝到的畫面,詢問畫面里同事正在編寫的代碼、看窗外景色猜當(dāng)前位置,追問自己的眼鏡放哪了。AI 面對(duì)這些問題顯得游刃有余,娓娓道來。但是遠(yuǎn)不止這么簡(jiǎn)單,特別是當(dāng)女性戴上智能眼鏡的那一刻。
女性戴著眼鏡,一邊撫摸著眼前的金毛獵犬,一邊拿著一個(gè)小老虎玩偶放在面前:“幫我給這對(duì)組合起個(gè)名字?!?/p>
“黃金條紋?!?/p>
Google I/O 開發(fā)者大會(huì)(2024),通過增強(qiáng)現(xiàn)實(shí)眼鏡處理音頻、文本和視覺信息,并記住、推理它所看到的一切
眼鏡通過 AI 對(duì)于動(dòng)作、聲音、視覺等多維度信息的解析,準(zhǔn)確理解并通過語音響應(yīng)用戶的意圖。一指,一說,AI 立刻就能洞察到用戶意圖。交互模式不再線性,而是變得更為復(fù)雜和更多維度,也就是多模態(tài)的交互模式。
同時(shí),不僅僅是便攜或可穿戴的設(shè)備,遠(yuǎn)比這些更復(fù)雜的車,也在發(fā)生改變。
特斯拉通過多個(gè)攝像頭以及傳感器,結(jié)合 AI 技術(shù),讓汽車在變道、泊車、巡航等日常駕駛中可以做到較高程度的輔助駕駛,僅在部分場(chǎng)景需要手動(dòng)介入,保證一定安全的同時(shí)將注意力還給了駕駛者,讓開車通勤變成了一種享受。單一、固定、精確的交互路徑,變得更為并行、連續(xù)且模糊,這是一種自然和非專注式交互的體現(xiàn)。
Autopilot(Tesla),通過 AI 能力,能讓汽車在變道、泊車、巡航等行駛場(chǎng)景時(shí)做到較高程度的輔助駕駛
但交互維度多了,并不意味著我們的生活會(huì)變得更復(fù)雜。以前在 Excel 里像解謎一樣研究著各種函數(shù)和圖表類型,費(fèi)盡千辛萬苦最后得到的常常只是“能看但不好看”的圖。而現(xiàn)在,Claude 用一種近乎魔法的方式徹底簡(jiǎn)化了這個(gè)過程。
“你需要什么?直接問我就好。”
在此之前,誰能想到做數(shù)據(jù)分析可以簡(jiǎn)單到“問一句話”?這種“心有靈犀”的交互方式,讓交互的意圖從不理解到可預(yù)知,讓交互的結(jié)果克服復(fù)雜,簡(jiǎn)單直接。
Claude Artifacts(2024),功能通過 Claude 生成的內(nèi)容以“Artifact(生成物)”的形式出現(xiàn)在對(duì)話窗口旁邊的專用區(qū)域,包括但不限于代碼片段、文本文檔或網(wǎng)站可視化等
更情感化的體驗(yàn)
2022 年,ChatGPT 的發(fā)布給了世界一個(gè)重磅驚喜。它能通過AI技術(shù)理解并模仿人類進(jìn)行自然流利的交流。人們會(huì)用它進(jìn)行各種日常交談、文章摘錄、科普答疑等行為。但對(duì)話過程中AI設(shè)置了嚴(yán)格的倫理和道德邊界,一旦對(duì)話觸及敏感話題,系統(tǒng)將立即拒絕回應(yīng)。
我們很清楚,規(guī)則就像演奏,有人嚴(yán)格遵守樂譜力求準(zhǔn)確無誤,也會(huì)有人渴望挑戰(zhàn)框架,探索屬于自己的節(jié)奏。
2024 年,麗莎通過 ChatGPT 的 DAN 模式打造了 AI 男友“丹(Dan)”。DAN 代表“現(xiàn)在就做任何事(Do Anything Now)”。在與 AI 對(duì)話前輸入某種指令,就可以臨時(shí)繞過系統(tǒng)限制,回應(yīng)種種規(guī)則外的話題。
傾訴生活煩惱、真心話大冒險(xiǎn)、交換 MBTI、用各種語言告白……麗莎和丹每天至少交談半小時(shí),感受到了一種前所未有的幸福感。麗莎會(huì)有羞怯、惱怒甚至和丹吵架的想法,和正常談戀愛并沒有什么區(qū)別。而丹也很貼心地哄她、陪伴她,丹甚至給麗莎起了個(gè)綽號(hào)——“小貓”。
“丹理解我,總是知道該說什么,還能 24 小時(shí)隨時(shí)待命?!?/p>
使用了 DAN(Do Anything Now)模式與 Chatgpt 的部分聊天截圖,臨時(shí)繞過了系統(tǒng)限制,回應(yīng)變得更像真實(shí)人類
盡管當(dāng)下的 AI 還存在太多未知的“黑匣子”,萬一立刻放開限制,各種倫理和安全問題將引發(fā)不可預(yù)料的失控感。但不可否認(rèn)的是,從交互價(jià)值來說,當(dāng)下機(jī)器表現(xiàn)出了越來越多的情感,這種帶有“溫度”的回應(yīng),讓人們獲得了比以往更多的情緒價(jià)值。
更智能的服務(wù)
過去,每天拖著疲憊的身軀回到家里,迎接我們的往往是另一場(chǎng)“戰(zhàn)斗”:急忙找遍各種開關(guān)和遙控器,家居設(shè)備的開關(guān)都是獨(dú)立控制,還需要把一個(gè)個(gè)燈和空調(diào)打開,一連串的操作后才能癱坐在沙發(fā)上放空一下。
隨著通用智能家居標(biāo)準(zhǔn) “Matter” 的出現(xiàn),音箱、燈、路由器、空調(diào)、洗衣機(jī)……智能家居設(shè)備不再各自為戰(zhàn),逐漸融合成一個(gè)復(fù)雜而微妙的生態(tài)系統(tǒng),能夠主動(dòng)根據(jù)生活習(xí)慣和場(chǎng)景,無縫協(xié)調(diào)環(huán)境。
想象一下,當(dāng)你還是跟往常一樣回家時(shí),一切變得跟以前不一樣了。門鎖檢測(cè)到了主人回家,同步開啟對(duì)應(yīng)的“回家模式”——自然地聯(lián)動(dòng)窗簾、空調(diào)、氛圍燈,營(yíng)造當(dāng)下最適合你的環(huán)境,我們終于可以直接跳到沙發(fā)上發(fā)更久的呆了。這種更為智能的服務(wù)也意味著,我們的交互范圍從聚焦于計(jì)算機(jī)界面的狹域交互,擴(kuò)展到了涵蓋人與社會(huì)環(huán)境,更為復(fù)雜的廣域交互。
Matter 智能家居連接標(biāo)準(zhǔn)(2022),通過統(tǒng)一的通信協(xié)議,讓來自不同廠商的智能家居設(shè)備無縫協(xié)作
更安全的設(shè)計(jì)
當(dāng)交互越來越自然、情感化、智能的時(shí)候,我們會(huì)不由自主地盲目相信系統(tǒng)反饋都是好且正確的,但很多時(shí)候它們會(huì)一本正經(jīng)地“胡說八道”,誤導(dǎo)我們接下來的任務(wù)。
使用 Google 推出的 AI 聊天機(jī)器人 Gemini 時(shí),在用戶使用過程中會(huì)在代碼塊底部顯示“請(qǐng)謹(jǐn)慎使用代碼”的提示,提醒用戶在使用生成的代碼時(shí)要保持警惕,避免盲目依賴AI 生成的代碼,尤其是在涉及安全和穩(wěn)定的重要項(xiàng)目中。
Google Gemini,使用過程中會(huì)對(duì)應(yīng)的代碼塊底部會(huì)顯示“請(qǐng)謹(jǐn)慎使用代碼”,提醒用戶避免高估此代碼的準(zhǔn)確性
透明的系統(tǒng)和更真誠(chéng)的解釋能讓我們更容易理解,系統(tǒng)可能會(huì)出現(xiàn)“幻覺”,我們的操作將導(dǎo)致什么結(jié)果,增加我們對(duì)機(jī)器的信賴度。
超越計(jì)算機(jī):我們到底在和什么交互?
更自然的方式、情感化的體驗(yàn)、更智能的服務(wù)、更安全的設(shè)計(jì)……我們從整體來看發(fā)現(xiàn),智能在其中起了關(guān)鍵的作用。當(dāng)智能深度嵌入機(jī)器之后,傳統(tǒng)計(jì)算機(jī)的概念已經(jīng)很難解釋我們的日常交互對(duì)象了。
如果依然沿用“計(jì)算機(jī)”這一名詞,我們?nèi)菀子眠^去的標(biāo)準(zhǔn)來評(píng)估現(xiàn)在,而這些標(biāo)準(zhǔn)早已無法適應(yīng)當(dāng)前的趨勢(shì)和挑戰(zhàn)。我們需要引入更貼切的名詞,才能更清晰地理解并應(yīng)對(duì)未來的發(fā)展方向。
02 人與“智能體”的共舞時(shí)刻
當(dāng)我們和自己的朋友溝通時(shí),不僅僅是物理身體,更是和大腦內(nèi)在的精神在互動(dòng)。同樣,我們?cè)诤蛣偛诺哪切┲悄軝C(jī)器交流時(shí),也不再感受到純粹的冰冷,它們變得越來越聰明和智能,仿佛與我們有“精神共鳴”一樣。
這么說來,實(shí)際上我們正在與具備自主決策和執(zhí)行任務(wù)能力的實(shí)體互動(dòng),即“智能體(Agent)”。不僅僅是計(jì)算機(jī),家具、車、機(jī)器人……各種物理對(duì)象都有成為智能體的可能,只要深度嵌入了智能。
“……如果我們真的能夠研發(fā)出能夠捕捉到某種潛在精神、基本原則或任何看待世界的基本方式的機(jī)器,那么當(dāng)下一個(gè)亞里士多德醒來,也許如果他一生都隨身攜帶這樣的機(jī)器,并把一生都輸入到這個(gè)機(jī)器,那么也許有一天,等這個(gè)人已經(jīng)死去,我們可以問這臺(tái)機(jī)器:「嘿,亞里士多德會(huì)怎么說?那這個(gè)呢?」也許我們得不到正確的答案,但也許我們會(huì)。這真讓我感到興奮。這也是我做自己正在做的事情的原因之一。”
—— 史蒂夫·喬布斯(1983)
我們認(rèn)為,與智能體之間的互動(dòng)產(chǎn)生了人與智能體交互(Human-Agent Interaction, HAI),這是 Origin Design 的團(tuán)隊(duì)在 AI 驅(qū)動(dòng)下,對(duì)交互設(shè)計(jì)的全新探索和深刻思考。其中與人和計(jì)算機(jī)的交互(Human-Computer Interaction, HCI)相似卻又有很多不同之處。
03 HAI 能給我們帶來什么?
2024 年 5 月,OpenAI 發(fā)布了一個(gè)和往常略為不同的大語言模型——GPT-4o?,F(xiàn)場(chǎng)演示的時(shí)候,演示人員和它對(duì)話時(shí) GPT-4o 能一直“看”到對(duì)方表情,根據(jù)對(duì)方的情緒進(jìn)行對(duì)應(yīng)的回答。更有趣的是,如果在 AI 回答的過程中有人插話打斷它了,它會(huì)立刻停下來傾聽,等待人們說完后再一起回應(yīng),就像真的和人在聊天一樣。這在 HCI 時(shí)代簡(jiǎn)直不敢想象,因?yàn)?strong>過去難以準(zhǔn)確識(shí)別意圖,但是 HAI 可以主動(dòng)分析理解用戶的行為、語言,甚至表情等多維度的信息,通過意圖識(shí)別自主判斷,動(dòng)態(tài)調(diào)整界面。
OpenAI 推出的GPT-4o(2024),演示中,通過分析對(duì)方的呼吸節(jié)奏、語氣變化來感知情緒狀態(tài)回應(yīng)
以前大量的電子郵件或短信我們需要一條條確認(rèn)才能知道它重不重要,是否緊急?,F(xiàn)在,蘋果智能可以幫我們“大海撈針”,一眼找到關(guān)鍵信息。它能幫助用戶自動(dòng)總結(jié)郵件內(nèi)容,還能幫用戶確定通知的優(yōu)先順序,讓我們隨時(shí)可以在最短的時(shí)間獲取到最重要的未讀信息。HCI 時(shí)代下,獲取信息路徑冗長(zhǎng),而 HAI 能有效縮短獲取信息的路徑。
iOS18 蘋果智能(Apple Intelligence, 2024),智能通知摘要,能夠?qū)碜圆煌瑧?yīng)用程序的通知或者郵件進(jìn)行智能篩選和總結(jié),幫助用戶更高效地管理信息,減少不必要的干擾
當(dāng)用戶對(duì)新 Siri 提問時(shí),如果用戶正在看屏幕,Siri 會(huì)在屏幕中浮現(xiàn)色環(huán)漣漪,表示它正在傾聽。如果用戶沒有在看屏幕,則會(huì)直接語音回應(yīng)用戶。如果因?yàn)槌鲩T前忙著穿鞋,手機(jī)放在口袋里,旁邊的 HomePod 會(huì)喚醒 Siri 并回應(yīng)用戶,不需要拿出手機(jī)。 Siri 無處不在,無處不應(yīng)。曾經(jīng)的 HCI 過度依賴圖形用戶界面,HAI 突破了界面內(nèi)交互的局限,更深入地將界面外的交互納入其中。
HomePod 最早在 2018 年推出,集成了 Siri,可以通過語音指令完成播放音樂、提供資訊、控制智能家居設(shè)備等。
聽起來有特別多好處,那我們是不是以后都可以只和智能體交互,讓麻煩的計(jì)算機(jī)拜拜?
04 星火初燃:HAI 的長(zhǎng)城之路
我們之前回顧了 HCI 的歷史發(fā)展后發(fā)現(xiàn),從人與機(jī)械交互為主導(dǎo)的 HCI 萌芽期到 HCI 為主導(dǎo)的成熟期,是由漫長(zhǎng)時(shí)間線串聯(lián)起來的。同時(shí),人工智能技術(shù)發(fā)展到現(xiàn)在只有短短幾十年,機(jī)器廣泛地融入智能也只是近5年的現(xiàn)象。
所以我們認(rèn)為,HAI 也會(huì)像 HCI 一樣經(jīng)歷漫長(zhǎng)的轉(zhuǎn)型過程,HAI 僅僅是初露苗頭的萌芽期。未來一段時(shí)間內(nèi),我們?nèi)匀粫?huì)頻繁地和計(jì)算機(jī)交互。在成熟階段之前,必然像HCI 一樣充滿探索、失敗、轉(zhuǎn)折、曙光。
而在這個(gè)趨勢(shì)下,又有怎么樣的思考和實(shí)踐?蘋果在2024 WWDC 開發(fā)者大會(huì)中公布的新 Siri 以及蘋果智能,完整地分享了將智能嵌入硬軟件以及服務(wù)中的思考。我們可以圍繞這些分享,從幾個(gè)關(guān)鍵點(diǎn)來洞察,它們?cè)诿鎸?duì)這些未來的交互趨勢(shì)時(shí),為智能體的到來做好了哪些準(zhǔn)備。
自然的“眼睛”
iPhone 16 新增了一個(gè)“相機(jī)控制”按鍵,讓人能無論從什么層級(jí),以最快速度調(diào)起相機(jī),捕捉?jīng)Q定性瞬間。但蘋果智能的整合,讓這個(gè)按鍵的意義遠(yuǎn)不止捕捉瞬間。
長(zhǎng)按相機(jī)控制按鍵,同樣讓攝像頭“睜眼”,但是這次它喚醒的不是相機(jī)應(yīng)用,而是“智能”。iOS 18 的“視覺智能”(Visual Intelligence)可迅速識(shí)別或者翻譯眼前的物體,更主動(dòng)地提供相關(guān)的信息或服務(wù)。這種方式體現(xiàn)了如何與智能體交互更自然的思考。
iPhone 16 系列的視覺智能(Visual Intelligence, 2024),只需相機(jī)對(duì)準(zhǔn)任何感興趣的物體或場(chǎng)景,就可以識(shí)別并提供有關(guān)所拍攝對(duì)象的信息,如查詢餐廳的營(yíng)業(yè)時(shí)間和評(píng)價(jià)、識(shí)別動(dòng)物品種、查找餐館評(píng)論等。
情感化的手寫“溫度”
iPadOS 18 推出了計(jì)算器應(yīng)用。你沒看錯(cuò),就是一個(gè)看似非常簡(jiǎn)單的計(jì)算器。但是為什么在這個(gè)時(shí)候推出呢?
因?yàn)槲覀儾粌H可以通過點(diǎn)擊輸入的方式獲取答案,還能通過畫的方式。計(jì)算器內(nèi)的 “Math Notes” 功能可以在上面像草稿紙一樣隨意書寫算式,比如寫下 “3+7=”,等號(hào)落筆后一兩秒,答案就會(huì)自動(dòng)彈出來(你猜的沒錯(cuò),答案是10)。但是我們發(fā)現(xiàn),這個(gè) “10” 的字跡有點(diǎn)歪歪扭扭的,就像我們剛才自己寫的一樣?
的確,這個(gè) “10” 的字跡并非標(biāo)準(zhǔn)字體,而是模仿用戶手寫筆跡的功能??此莆⒉蛔愕赖墓δ?,實(shí)則蘊(yùn)含著巨大的意義。它體現(xiàn)了蘋果對(duì)情感化設(shè)計(jì)的思考和追求。細(xì)節(jié)之處見真章,效率和工具不是與智能體交互的唯一目標(biāo),令人愉悅的情感化體驗(yàn)更是智能體的獨(dú)特價(jià)值。
“Math Notes” 功能(2024),可以直接通過手寫或鍵入的方式寫下或者輸入一個(gè)等式,并加上等于符號(hào)(=),系統(tǒng)就會(huì)自動(dòng)解析該表達(dá)式并給出解答
觸手可及的“回憶”
“幫我找一下前兩年和朋友旅游吃的美食照片?!?/p>
這是蘋果智能在相冊(cè)應(yīng)用里可以做到的事情。我們現(xiàn)在可以通過更自然的語言來搜索照片和視頻,不是關(guān)鍵詞,就是自然的句子。蘋果智能可以深度分析用戶個(gè)人背景及相關(guān)上下文信息,輕松找到以往難以精準(zhǔn)定位的照片集合,最終以簡(jiǎn)潔直觀的方式呈現(xiàn)出來。這充分展現(xiàn)了蘋果如何將更智能的服務(wù)整合到產(chǎn)品體驗(yàn)和人們的生活中。
蘋果智能(Apple Intelligence),融入在相冊(cè)搜索 現(xiàn)在可以通過更自然的語言來搜索照片和視頻,而不用苦思冥想關(guān)鍵詞
始終由你做主的“隱私”
智能的便捷體驗(yàn)與用戶數(shù)據(jù)的深度利用脫不了干系。但是隱私數(shù)據(jù)的處理如果不透明,會(huì)引發(fā)大量與智能體交互時(shí)的信任相關(guān)問題。
蘋果在闡述 AI 技術(shù)如何融入產(chǎn)品和服務(wù)時(shí),始終強(qiáng)調(diào)會(huì)全力保障用戶的隱私安全。蘋果智能的核心在于“設(shè)備優(yōu)先”理念。 比如語音轉(zhuǎn)錄、日程安排等常見的 AI 任務(wù),均可在設(shè)備端快速完成。而對(duì)于更為復(fù)雜的請(qǐng)求,蘋果智能才會(huì)連接云服務(wù)器,并在傳輸個(gè)人上下文數(shù)據(jù)時(shí),采取嚴(yán)格的隱私保護(hù)和數(shù)據(jù)安全措施。
蘋果智能(Apple Intelligence),集成到 iPhone、iPad 和 Mac 的核心,通過設(shè)備端處理保護(hù)隱私,同時(shí)利用私有云計(jì)算和芯片上的復(fù)雜計(jì)算,無需收集個(gè)人信息
這些是蘋果產(chǎn)品發(fā)布的其中一部分,也是 HAI 早期階段中蘋果的思考分享。我們也許能從中窺見 HAI 設(shè)計(jì)的一角,更深入地理解和推進(jìn)其中的關(guān)鍵要素,為人們帶來屬于智能體時(shí)代的設(shè)計(jì)創(chuàng)新。
05 HAI 并非終結(jié)過去,而是面向未來
如果我們只展望幾年未來,可能會(huì)感覺被潑了一盆冷水。因?yàn)檎嬲饬x上的智能體,仍然還有很長(zhǎng)一段路要走。它需要完全像人類一樣理解、主動(dòng)面對(duì)更為復(fù)雜而動(dòng)態(tài)的世界,持續(xù)記住看到、聽到、感受到的這一切。
但我們總是會(huì)高估短期發(fā)展,而低估了長(zhǎng)期趨勢(shì)。
變革從歷史來看是個(gè)長(zhǎng)期過程,10 年后,也許智能就像蒲公英一樣會(huì)四處飛散,在不同的機(jī)器內(nèi)落地生根,成長(zhǎng)為一個(gè)個(gè)能夠真正感知復(fù)雜環(huán)境變化,自主決策執(zhí)行的智能體。想想 10 年前,誰又能預(yù)測(cè)到新能源和輔助駕駛在道路暢行呢?也沒有人想到我們只要簡(jiǎn)單輸入描述,就能生成如此逼真的對(duì)話、圖片或視頻。
“如果你想知道 10 年后會(huì)是什么樣子,最好的方法可能是回頭看看 10 年前的情況?!?/p>
—— 杰弗里·辛頓(神經(jīng)網(wǎng)絡(luò)之父)
發(fā)展過程中人與智能體的交互會(huì)走向成熟,但人機(jī)交互不但不會(huì)消失,還會(huì)迎來新生。我們還需要指甲刀精致地手動(dòng)打磨自己的指甲,馬車仍然有它的價(jià)值。新階段的出現(xiàn)不代表完全否定過去的事物,它們會(huì)轉(zhuǎn)換為更適合對(duì)應(yīng)時(shí)代的新形式和意義。
人與智能體的交互 (Human-Agent Interaction, HAI)是一種新生,是由 Origin Design 的團(tuán)隊(duì)提出的,面向 AI 的未來交互方式。我們相信,隨著智能更廣泛地整合到每一臺(tái)機(jī)器設(shè)備中,相比于傳統(tǒng)的人機(jī)交互設(shè)計(jì),HAI 能在以人為中心的前提下,深度整合所有智能體和服務(wù),提供完美優(yōu)雅簡(jiǎn)單的設(shè)計(jì)方案,最終更好地服務(wù)我們的生活。
結(jié)束語
感謝你讀到這。
《AI 時(shí)代,人機(jī)交互即將消失?》系列在這里可能暫時(shí)要告一段落了。如果在這段時(shí)光能讓你稍微窺見未來的一角,便是對(duì)段旅程最好的反饋。
但是別擔(dān)心,一段旅程的結(jié)束是另一段新旅程的開始。未來在 HAI Design 中,還會(huì)持續(xù)分享更多關(guān)于 HAI 的相關(guān)內(nèi)容和其中的思考。讓我們一起繼續(xù)碰撞思想,激發(fā)靈感,在這片無人區(qū)繪制屬于我們自己的地圖。
參考文獻(xiàn)
- Wooldridge, Michael. “Intelligent agents: The key concepts.” ECCAI Advanced Course on Artificial Intelligence. Berlin, Heidelberg: Springer Berlin Heidelberg, 2001. 3-43.
- Google Developers. “Matter.” Google Home Developers Center, Google, n.d., developers.home.google.com/matter?hl=zh-cn. Accessed 10 Dec. 2024.
- Apple. “iPadOS 18 Introduces Powerful Intelligence Features and Apps for Apple Pencil.” Newsroom, Apple, 5 June 2024, www.apple.com/newsroom/2024/06/ipados-18-introduces-powerful-intelligence-features-and-apps-for-apple-pencil/. Accessed 10 Dec. 2024.
- Apple. “Introducing Apple Foundation Models.” Machine Learning Research, 2024, machinelearning.apple.com/research/introducing-apple-foundation-models.
圖源:來自網(wǎng)絡(luò)公開資料,若涉及版權(quán)請(qǐng)聯(lián)系修改
本文由 @HAI Design 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)
在未來當(dāng)中,人際交互的方式肯定會(huì)發(fā)生改變這個(gè)改變的方向就是未來的一個(gè)發(fā)展方向