RICH設(shè)計范式,AI產(chǎn)品的人機界面設(shè)計范式?
“RICH 設(shè)計范式:AI 界面設(shè)計新探索。” 在人工智能時代,人機界面設(shè)計面臨新挑戰(zhàn)。RICH 設(shè)計范式如何應(yīng)運而生?它將如何重塑 AI 產(chǎn)品的用戶體驗?讓我們一同揭開其神秘面紗。
RICH設(shè)計范式是Ant Design提出來的一個AI界面設(shè)計范式,類似于圖形用戶界面的WIMP范式。它在回答我們該如何在智能時代下,設(shè)計一個AI產(chǎn)品的交互界面。
什么是WIMP范式?
在人機交互領(lǐng)域,WIMP 范式即 “Windows, Icons, Menus, Pointer”,是指一種通過窗口、圖標、菜單和指針四種基本元素來實現(xiàn)人機交互的方式。
窗口:是一個獨立的程序運行空間,不同程序可在各自窗口中同時運行且相互隔離。在多任務(wù)操作系統(tǒng)中,用戶可同時打開多個窗口,進行文字編輯、瀏覽網(wǎng)頁、查看郵件等操作,并可通過窗口管理功能對其進行移動、縮放、切換、關(guān)閉等操作。
圖標:作為計算機執(zhí)行動作的快捷方式,一個圖標通常代表一個應(yīng)用程序、文件、文件夾或系統(tǒng)功能。例如桌面上的瀏覽器圖標,用戶點擊即可快速啟動瀏覽器程序。
菜單:是基于文本或圖標的選擇系統(tǒng),用于選擇和執(zhí)行各種程序或任務(wù),會根據(jù)不同上下文環(huán)境而變化。例如在文字處理軟件中,菜單提供文件操作、編輯功能、格式設(shè)置、排版選項等相關(guān)命令。
指針:是屏幕上的符號,代表用戶控制的物理設(shè)備的移動,用于選擇圖標、數(shù)據(jù)元素等。常見的指針設(shè)備有鼠標、觸摸板等,用戶通過移動指針并點擊相應(yīng)元素來執(zhí)行操作。
可以說我們目前所有的屏幕界面設(shè)計,包括現(xiàn)在的AR和VR設(shè)計,都還沒有脫離這個范式去進行過設(shè)計。
什么是RICH范式?
人與機器的交互方式始終會隨著底層技術(shù)的發(fā)展而產(chǎn)生變化,新的界面交互形式到底是什么?也是我在《AI后的UX|設(shè)計師專業(yè)能力構(gòu)建的2個新方向》里提到的1個重點方向。
在這張圖里,我們可以見證人機界面的交互形式隨著技術(shù)革新的變遷,但我倒是覺得:我們的范式依然還處于NUI下,不過具體到能回答設(shè)計師該關(guān)注哪些設(shè)計元素的范式的確還沒有定論。
而RICH范式嘗試回答了這個問題。
意圖、角色、對話、混合界面,是設(shè)計師需要關(guān)注的四個要素。每一個要素,解決一個在設(shè)計AI產(chǎn)品時的關(guān)鍵疑問。
設(shè)計AI產(chǎn)品時要面對的4個關(guān)鍵問題
第一、AI怎樣才能理解并幫助用戶解決意圖?
在智能體的設(shè)計中,這是最初的一步。因為從人際交互的角度來說,只有當雙方能夠理解彼此,我們才可能擁有比較流暢的交流,人機交互也一樣。
但在我的實踐中我發(fā)現(xiàn),當我們要思考和思考AI怎樣才能理解并幫助用戶解決意圖之前,首先要先定義清楚的是:
什么是AI的能理解?
什么是AI的不能理解?
比如,在我最近做的項目中,AI的能理解被定義為XX知識庫內(nèi)&日常溝通相關(guān)。
那什么又是日常溝通相關(guān)的?最簡單的,比如我在中文系統(tǒng)里輸入Hello,它會覺得不能理解嗎?
你會發(fā)現(xiàn),在人際交往中似乎不是問題的,成為了智能體設(shè)計中的問題。
在這個問題上,我們的技術(shù)人員撓了撓頭,說那得取決于我能用的大模型了。
第二、AI將以怎樣的人設(shè)和形象面對用戶?
就像每個人有每個人的形象、語氣、認知、習(xí)慣外,越來越能夠通過自然交互與人類交流的“機器”自然也需要有。
我之前把它稱作IP(Intellectual Property)設(shè)計,RICH里叫做角色設(shè)計。
RICH里面提到的角色設(shè)計有三個需要設(shè)計的內(nèi)容:
性格內(nèi)核: 角色行為、決策與情感反應(yīng)的根本驅(qū)動力,包含核心性格特質(zhì)、價值觀、信仰動機和情感狀態(tài)。
專業(yè)能力: 角色在特定領(lǐng)域內(nèi)掌握的知識技能、實踐經(jīng)驗及解決問題的專長,支撐其職業(yè)表現(xiàn),實現(xiàn)功能價值。
外在形象: 外觀特征、服飾風格、肢體語言及聲音特點等,是角色個性與背景故事的視覺與聽覺體現(xiàn)。
優(yōu)先解決專業(yè)能力,因為它決定了為什么用戶需要和這個智能體交流,什么時候需要和這個智能體交流。換言之,對智能體的專業(yè)能力具體到可實操層的定義,決定了它為什么而存在。
第三、AI該如何表達用戶才能聽得懂,聽得舒服?
對話設(shè)計和以往的設(shè)計相比,我覺得最大的區(qū)別在于什么時候“隱性”處理。
因為開始和結(jié)束不一定要說你好和再見,追問也不一定在末尾單獨生成幾個擴展問題才叫追問,提示和確認可能全部隱藏在語言中,錯誤也不是GUI設(shè)計中那種錯誤,只是人際交往中最常見的情況。
這是我詢問AI和它的交互流程是什么,它給我的回答,供設(shè)計參考:
第一步:接收輸入等待并接收你發(fā)送的文本內(nèi)容,涵蓋各類問題、指令、話題描述等信息。
第二步:理解意圖。運用自然語言處理技術(shù)對所接收的文本進行分析,盡力準確把握你想要表達的核心意圖、期望達成的目標,例如是尋求知識解答、進行文案創(chuàng)作、要求語言翻譯,還是單純的閑聊等不同情況。
第三步:信息檢索與整合(如有需要)如果你的問題涉及到需要外部信息來輔助回答的情況,會在相關(guān)知識庫、數(shù)據(jù)源中進行檢索,篩選出合適且準確的信息,并按照一定邏輯進行整合。
第四步:生成回復(fù)基于對意圖的理解以及檢索整合的信息(若有),通過語言生成模型等技術(shù),按照符合語言規(guī)范、邏輯清晰、重點突出等要求來構(gòu)建相應(yīng)的回復(fù)內(nèi)容。
第五步:輸出回復(fù)將生成好的回復(fù)內(nèi)容發(fā)送給你,以便你能查看并繼續(xù)開展后續(xù)的交流互動。第四、如何組織、操作多行為融合的界面?
這是需要和具體的場景、產(chǎn)品深度綁定才能回答的一個問題。
RICH給出的答案是基于目前最常用的Chat模式給出的,不同的產(chǎn)品、設(shè)備終端變化都可能讓這個答案的具體形式產(chǎn)生變化。
比如XR設(shè)備的用戶輸入,可能不一定是有形的聊天一般的文字等內(nèi)容輸入,可能是聲音的輸入,也可能是行為的輸入。
RICH基于PC終端來給出的分類給了很好的參考:
Do 為主: 以界面操作為主,偶爾喚起 AI 快捷指令。例如 Quick Bar、固定指令式、內(nèi)嵌生成式等。
Do + Chat 均衡: 自然語言與界面操作均衡配合。例如雙區(qū)聯(lián)動交互、交互式操作氣泡等。
Chat 為主: 以自然語言為主,幾乎沒有界面操作。例如側(cè)邊式 Copilot、獨立 Web Bot 等。
RICH設(shè)計范式為我們提供了一個在AI時代下設(shè)計智能界面的新思路。它通過四個關(guān)鍵要素來指導(dǎo)設(shè)計:
意圖(Intent)幫助我們思考AI如何理解用戶需求
角色(Role)定義AI的形象與能力
對話(Interaction)探索自然的交互方式
混合界面(Hybrid)解決多模態(tài)交互的整合問題
但具體到每個場景如何理解和使用它,依然需要我們自己的探索、研究、驗證。
最后,借用一位設(shè)計師所說:”在AI時代,最好的界面設(shè)計不是讓機器模仿人類,而是讓人機交互變得自然而然。”
本文由人人都是產(chǎn)品經(jīng)理作者【林影落】,微信公眾號:【林間有影落】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
RICH不是 Role, Intention, Conversation, Hybrid嗎 ’對話(Interaction)探索自然的交互方式‘ 這里是不是寫錯了