生成式AI助手設(shè)計(jì)指南(上篇)

1 評論 6076 瀏覽 84 收藏 37 分鐘

與常規(guī)的產(chǎn)品設(shè)計(jì)不同,生成式AI助手的設(shè)計(jì)要素需要特別處理。這篇文章為設(shè)計(jì)和評估AI助手提供了全面的視角,強(qiáng)調(diào)了用戶體驗(yàn)的重要性,并提出了一系列實(shí)用的設(shè)計(jì)策略。

自2022年11月ChatGPT橫空出世以來,世界好像被顛覆了。各類生成式AI迅猛發(fā)展,其中生成式AI助手以其獨(dú)特的創(chuàng)造力和智能性,重新定義了許多產(chǎn)品的使用方式。

它通過先進(jìn)的自然語言處理技術(shù),不僅能理解用戶的指令和問題,還能生成回答、撰寫文本、甚至創(chuàng)作內(nèi)容,拓展了人機(jī)交互的邊界,帶給人們極大的便利。

全球的技術(shù)巨頭和創(chuàng)新型初創(chuàng)公司都紛紛投身于生成式AI這一必爭之地,各大廠商都在積極探索如何將生成式AI助手融入到自己的產(chǎn)品和服務(wù)中。

本文將從UX設(shè)計(jì)的角度,拆解生成式AI助手的關(guān)鍵設(shè)計(jì)要素,思考AI助手產(chǎn)品的設(shè)計(jì)原則與體驗(yàn)評估思路,并給出具體業(yè)務(wù)案例的實(shí)踐過程,希望能給身處AI浪潮中的你,一點(diǎn)幫助和啟示。

一、關(guān)鍵設(shè)計(jì)要素

生成式AI助手(以下簡稱AI助手)的界面設(shè)計(jì)集中于打造一個(gè)直觀、友好的交互體驗(yàn)。

目前主要通過文本和語音這兩種最自然的交流方式與用戶進(jìn)行互動(dòng)。它強(qiáng)調(diào)友好的提示和引導(dǎo)、清晰的輸入輸出機(jī)制,以消除用戶使用的陌生感和不安感,同時(shí)擴(kuò)展了多模態(tài)交互、個(gè)性化設(shè)置和輔助功能,適應(yīng)不同用戶的需求。另外,在界面上也注重展示AI生成內(nèi)容的易讀性和美觀性,使用戶在使用時(shí)感到輕松愉快。

下文將圍繞AI助手最核心的輸入輸出頁面中的關(guān)鍵設(shè)計(jì)要素進(jìn)行拆解和分析,主要包括功能/指令/智能體的應(yīng)用、輸入輸出過程以及語音通話等。

1. 功能

AI助手中的功能,指的是AI助手能夠執(zhí)行的具體任務(wù)或操作。例如,文本理解、語音識別、翻譯、搜索信息等能力。

通過我們的調(diào)研,發(fā)現(xiàn)很多設(shè)計(jì)師會把功能的概念與指令和智能體混淆。指令是用戶給AI助手的命令,用來激活或使用特定的功能,而智能體具有一定智能的軟件程序,能夠執(zhí)行任務(wù)、解決問題或與用戶進(jìn)行交互。在AI助手中,智能體可能是負(fù)責(zé)特定任務(wù)的實(shí)體,如搜索智能體、推薦智能體等。

簡單來說,功能是AI助手已經(jīng)會的本事;指令是告訴AI助手你想要它做什么;智能體是AI助手里面的小幫手,各自負(fù)責(zé)不同的任務(wù)。

1)功能引導(dǎo)

AI助手有豐富的功能,受限于產(chǎn)品形態(tài),在功能的引導(dǎo)上有3個(gè)區(qū)域的觸點(diǎn):

  1. 歡迎卡片:做新手引導(dǎo)和推薦快捷指令展示。
  2. 輸入框上方:推薦快捷功能指令。
  3. 輸入框內(nèi)部:通過引導(dǎo)文字推薦功能。

2)歡迎卡片

絕大多數(shù)的產(chǎn)品都會在歡迎卡片里提供快捷功能,點(diǎn)擊后當(dāng)作快捷指令會被填充至輸入框(或直接向AI提問),通常會加上“可以試著問”、“可以這樣問”、“我有以下技能”等等引導(dǎo)性語句,能清晰的引導(dǎo)用戶使用。

大多數(shù)產(chǎn)品都以2*N(3居多)的形式展示,盡可能在有限的空間里放下最多的功能入口。存在較多功能,會提供「換一批」的能力,或提供指令中心的入口??旖葜噶钤赨I設(shè)計(jì)上,入口icon較多使用emoji,原因是快捷功能數(shù)量多,且很難用圖形展示,因此需要設(shè)計(jì)成本低且能靈活配置的解決方案。當(dāng)然如果推薦功能較少,也可以像釘釘文檔一樣,使用個(gè)性化的icon處理。

根據(jù)不同產(chǎn)品的定位,也可以不展示快捷入口,如Kimi能分析網(wǎng)址和文件,直接用文字輕量化地引導(dǎo)用戶添加內(nèi)容,但是沒有明確可點(diǎn)擊的入口,引導(dǎo)性較弱。

3)輸入框上方

點(diǎn)擊后快捷指令填充至輸入框,因此放在輸入框上方能讓用戶感知到二者的聯(lián)系,并支持橫向滑動(dòng)展示更多入口,但承載能力有限,且不方便用戶感知全部的功能。

4)輸入框內(nèi)部

采用文字提示的方式,告知用戶可以使用的快捷鍵觸發(fā)相應(yīng)的功能,但文字提示效果沒btn明顯,導(dǎo)致容易被忽視。

5)功能中心

隨著AI助手的迭代,功能會越來越多。此時(shí)就需要功能中心來聚合全部的功能,并將它們清晰的展示給用戶,有三種展示方式。

  1. 大模態(tài)彈窗:騰訊使用大模態(tài)彈窗。讓用戶在不跳脫出當(dāng)前層級關(guān)系的情況下,也能有清晰的展示空間和篩選能力,方便用戶完成功能選擇。
  2. 獨(dú)立頁面:釘釘使用獨(dú)立頁面,展示面積大,功能過多時(shí)可以使用,支持使用清晰的Tab分類和快捷幀等功能,對功能進(jìn)行細(xì)致的分類。且支持對功能做較詳細(xì)的圖文介紹,方便用戶理解功能并建立預(yù)期。
  3. 浮層:如云一朵,點(diǎn)擊功能中心后會調(diào)起浮層,支持做簡單的Tab切換來分類功能,層級關(guān)系簡單更加輕量化,支持承載數(shù)量較少的功能。

以上三種展示方式并無絕對好壞之分,需要設(shè)計(jì)師根據(jù)自身產(chǎn)品的情況來選擇合適的方式。

6)快捷指令

指令是用戶給出的命令或請求,AI助手根據(jù)指令來執(zhí)行相應(yīng)的功能。例如,用戶可能會說“請翻譯這段話”,這里的“翻譯這段話”就是一個(gè)指令。

快捷指令能有效提高用戶輸入指令的效率和準(zhǔn)確性,它提供了一種直觀、簡潔的方式來與AI工具進(jìn)行交互,使用戶能夠更輕松地完成任務(wù),并給用戶提供了一種跟AI溝通的范例。

7)推薦功能

上文提到的推薦功能,往往都會以快捷指令的形式填充到輸入框內(nèi),在功能推薦的卡片上甚至?xí)怙@快捷指令,讓用戶有心理預(yù)期。

8)猜你想問

通過分析用戶的習(xí)慣和上下文,AI工具能夠預(yù)測用戶可能想要提出的問題或需求,并主動(dòng)提供相關(guān)信息或建議。這種主動(dòng)服務(wù)的方式減少了用戶的搜索時(shí)間,從而提升了用戶體驗(yàn)。同時(shí)通過提供主動(dòng)、智能的服務(wù),增強(qiáng)了用戶對AI工具的依賴和信任。

在設(shè)計(jì)上猜你想問的觸點(diǎn)有兩處:首次進(jìn)入和回答結(jié)束。

  1. 首次進(jìn)入:為用戶提供一個(gè)友好的、有引導(dǎo)性的開始,幫助用戶更快地適應(yīng)和使用工具。反之,如果推送不準(zhǔn)確或不符合用戶的實(shí)際需求,可能會讓用戶感到困惑或不滿。
  2. 回答結(jié)束:AI能夠根據(jù)用戶的反饋和上下文進(jìn)行進(jìn)一步地推測,這通常能夠提供更準(zhǔn)確、更相關(guān)的建議或信息。這種推送能夠讓用戶感到AI工具能夠理解他們的需求并提供有價(jià)值的信息。

2. 智能體

在AI助手中,智能體是負(fù)責(zé)處理特定任務(wù)的模塊,如語言理解智能體、推薦系統(tǒng)智能體等。

1)智能體中心

和功能中心一樣,在智能體中心里聚合了全部的智能體,通過設(shè)計(jì)清晰的Tab分類和檢索功能幫助用戶查找自己想要的內(nèi)容。

2)智能體使用

智能體的操作流程和AI助手本身的操作要保持一致,層級關(guān)系也需要兼融進(jìn)AI助手內(nèi)。比如豆包,將智能體的聊天記錄放在在AI助手的聊天列表頁內(nèi),并根據(jù)頭像和名稱幫助用戶完成智能體的身份識別,結(jié)構(gòu)清晰方便用戶找到功能并使用。

而Kimi支持通過輸入框快捷使用智能體的能力,選擇完成后會外顯在輸入框上方,此時(shí)向智能體提問,原本AI助手的頭像會變成智能體,給予用戶正在使用的反饋。

3. 輸入框

輸入框承載了用戶與AI溝通中“說”的需求,最重要的功能是輸入。

1)輸入方式

根據(jù)AI助手功能的不同,輸入框的輸入方式也不同,常見的輸入方式如下:

  • 文本輸入:最基本的方式,提供一個(gè)易用的文本框,讓用戶可以方便地輸入文題或指令。
  • 語音輸入:語音輸入按鈕允許用戶通過語音指令與 AI 互動(dòng),需要注意語音識別的反饋。
  • 多模態(tài)輸入:結(jié)合文本、語音、圖片、附件、槽位等多種輸入方式,提升交互的靈活性。
  • 快捷輸入:根據(jù)上下文提供常用的快速回復(fù)按鈕,方便用戶一鍵選擇常用選項(xiàng)或回復(fù)?;蚴褂每旖萱I(如“@”或“/”)調(diào)出可用的指令或文件等。

2)功能要素

在輸入框中,最低配就是僅有輸入?yún)^(qū),隨著各AI助手功能的完善,也越來越少見了。而高配就各有特色了,有語音輸入、語音通話、文件上傳、快捷功能、發(fā)送、開啟新對話這些固定入口,也有根據(jù)輸入輸出過程動(dòng)態(tài)出現(xiàn)的停止生成按鈕、槽位框、文案優(yōu)化按鈕等。

3)輸入和發(fā)送btn

輸入?yún)^(qū)是輸入框最重要的組成部分,支持用戶進(jìn)行文本輸入。

同時(shí)也是用戶引導(dǎo)的最佳區(qū)域,起初用“請輸入XXX”這些基礎(chǔ)文案完成了大眾的AI教育。隨后隨著大家的認(rèn)知增強(qiáng)、功能的豐富以及其他引導(dǎo)區(qū)域的不斷開辟,現(xiàn)在Web端的引導(dǎo)文案更加偏重更高級功能的引導(dǎo),如快捷功能調(diào)起和換行等。

發(fā)送btn也是重要組成部分。可以幫用戶區(qū)分“可用”和“不可用”狀態(tài)(如多數(shù)AI助手設(shè)定為AI回答完畢前無法發(fā)送)。設(shè)計(jì)時(shí)可以通過顏色差異反饋給用戶,如果是不可用狀態(tài),最好是通過反饋告知用戶不可操作的原因。

受限于空間,移動(dòng)端的發(fā)送btn通常默認(rèn)隱藏、輸入內(nèi)容后才顯示。

4)語音按鈕

當(dāng)前語音輸入在移動(dòng)端使用較多,受限于電腦的辦公場景,語音錄入在Web或桌面端較少。

百度云的云一朵也支持語音錄入,并提供了兩種語音輸入方式:

  1. 按住空格鍵錄制、松手發(fā)送、esc取消發(fā)送。
  2. 點(diǎn)擊語音鍵錄制、點(diǎn)擊發(fā)送按鈕發(fā)送、點(diǎn)擊關(guān)閉按鈕取消發(fā)送。

而移動(dòng)端的語音按鈕與IM語音輸入大致一樣,受限于篇幅不再贅述。

5)上傳文件

AI助手的上傳文件功能允許用戶將本地文件上傳到AI系統(tǒng)中,以便進(jìn)行后續(xù)的處理、分析或存儲。

在狀態(tài)反饋方面,需要注意的是無論在Web端還是移動(dòng)端都需要給用戶提供清晰的反饋,包括:

  • 進(jìn)度反饋:提供實(shí)時(shí)的上傳進(jìn)度顯示,讓用戶隨時(shí)了解文件上傳的進(jìn)度。
  • 狀態(tài)反饋:顯示上傳成功或失敗的信息,提供相應(yīng)的操作引導(dǎo)。尤其是遇到錯(cuò)誤時(shí),要給用戶提供清晰的提示信息,如文件格式不支持、文件大小超過限制等,并提供重新上傳或取消上傳的操作選項(xiàng),以便用戶根據(jù)提示進(jìn)行相應(yīng)的處理。當(dāng)然,如果存在文件的上傳限制,最好在操作前就給出提示反饋。

在布局方面,已上傳的文件與輸入框的位置關(guān)系需要靈活處理,既不可以影響文本輸入,又需要考慮與輸入框的鄰近性與統(tǒng)一性;此外,還要考慮上傳文件數(shù)量對于布局的影響。

6)槽位

在用戶給的信息太少,不足以生成可用的答案時(shí),通常需要用戶補(bǔ)充一些結(jié)構(gòu)化的信息。這些信息可以通過兩種方式錄入:答案氣泡中或輸入框。答案氣泡的我們后文討論,這里討論下輸入框。

在輸入框中可以通過槽位來錄入,槽位由一個(gè)或一組輸入框組成,區(qū)別于字段化的表單,這些輸入框之間往往由一句話或者自然語言來連接。

需要注意的是,槽位可能增加用戶的操作復(fù)雜度,尤其是涉及到推薦指令修改時(shí),將槽位誤刪等情況;可能占用過多空間導(dǎo)致頁面局促,讓本就不富裕的輸入框雪上加霜,影響編輯體驗(yàn)。

考慮槽位適合哪些組件,交互過程不宜太復(fù)雜,建議只當(dāng)「單選選擇器」或「輸入框」使用。

考慮容錯(cuò)性問題,如誤刪后挽回辦法。

區(qū)分槽位與字段的關(guān)系,如增強(qiáng)差異化,提升用戶的認(rèn)知。

7)文本優(yōu)化

文本優(yōu)化功能是為了提升用戶的輸入效率、讓AI更加準(zhǔn)確地理解用戶意圖。

通常在用戶輸入文本內(nèi)容后激活,點(diǎn)擊可以對已輸入的文本進(jìn)行優(yōu)化,比如糾正錯(cuò)別字、簡化表達(dá)、補(bǔ)全提問的維度(比如背景、范圍、要求、指令等)。

這其實(shí)是AI對于用戶問題的一次“預(yù)理解”,生成的優(yōu)化文本可供用戶進(jìn)行確認(rèn)、修改,以此生成更準(zhǔn)確的回答,提升對話效率和使用體驗(yàn)。

這里需要注意的是功能入口的可見性以及各狀態(tài)和對應(yīng)操作的設(shè)計(jì),將會在后面業(yè)務(wù)案例部分與大家探討。

8)清除/新對話按鈕

當(dāng)用戶想開啟新話題、避免歷史信息干擾時(shí),當(dāng)對話信息過長影響性能時(shí),或僅僅當(dāng)用戶希望界面更清爽時(shí),都可以選擇清除對話或開啟新對話。

按鈕應(yīng)放置在用戶容易找到且不會干擾到主要交互流程的地方。在Web AI助手中,這些按鈕可以放在界面的底部或側(cè)邊欄中。需要注意的是,清除/新對話按鈕通常與對話管理功能關(guān)聯(lián)出現(xiàn),用戶可追溯之前的歷史對話。

4. 回答消息體

在接收到用戶的問題或指令后,AI會生成回答?;卮鹂赡苁切畔?、指導(dǎo)、建議、拒絕、互動(dòng)等,這需要豐富的消息體類型來支持??傮w來說,回答消息體包括純文本、鏈接、圖片、視頻、按鈕/選項(xiàng)、輸入框、編輯器等類型。

1)文本消息

包含純文本和富文本兩種。其中純文本以直接的文字回復(fù),簡潔明了,適用于簡單的問答。而富文本則包含鏈接、加粗、顏色等格式的文本,適合提供更詳細(xì)的信息或引導(dǎo)用戶進(jìn)一步操作。

2)多媒體消息

圖片、視頻、音頻、代碼編輯器等,可以豐富用戶體驗(yàn),適合展示產(chǎn)品、提供多媒體內(nèi)容等。

3)卡片式消息

包含標(biāo)題、圖片、按鈕等元素的卡片,適合展示結(jié)構(gòu)化信息,如新聞、商品、天氣等。

4)交互式表單

類似于槽位,交互式表單也是收集用戶結(jié)構(gòu)化信息的一種方式,可以字段化的表單形式出現(xiàn)在回答區(qū)域,來獲取用戶的更詳細(xì)的信息。

除了一些需要引導(dǎo)用戶逐步填寫信息的復(fù)雜場景(如預(yù)約、注冊等),交互式表單通常以更輕量的按鈕/選項(xiàng)、輸入框的形式出現(xiàn),用戶可以快速選擇或輸入。用戶操作后信息狀態(tài)發(fā)生變化。

相比于槽位,交互式表單的擴(kuò)展性、可讀性、狀態(tài)顯示與容錯(cuò)性會更好一些。

5. 對話氣泡功能

在人與AI的對話中,內(nèi)容通常以氣泡的形式來顯示,邊界清晰,也便于添加功能。功能主要集中在對用戶自己發(fā)送的指令和AI回答的內(nèi)容做出反饋和操作。

1)展示方式

對話氣泡的操作區(qū)域分為常駐和Hover兩種:

  1. 常駐:在Web端和移動(dòng)端都有使用。Web端經(jīng)常在全頁面采用,因?yàn)橛凶銐虻目臻g展示,而且方便讓用戶及時(shí)操作;而移動(dòng)端因?yàn)闊o法做出Hover效果,所以都采用常駐。
  2. Hover:Web端中尺寸局促的浮窗或抽屜會使用Hover,但是Hover需要在設(shè)計(jì)時(shí)留出足夠的預(yù)設(shè)空間,因此會造成氣泡間的距離過大的問題。同時(shí)Hover的場景要考慮氣泡間的排版問題,早期很多AI產(chǎn)品將浮層會出現(xiàn)的位置預(yù)留了空間,但是會造成未Hover時(shí)氣泡的上下間距過大,浪費(fèi)坪效。

現(xiàn)在很多產(chǎn)品都采用了從側(cè)面出現(xiàn)的方式,解決間距問題,但是對氣泡的長度有要求限制,不能滿足空間較小的場景。個(gè)人認(rèn)為最理想的解決方式是讓反饋浮層卡在氣泡邊緣,盡可能的節(jié)約空間。

2)反饋操作

用戶指令和AI回答有不同的反饋功能。

用戶指令:包括復(fù)制、再次編輯和刪除等能力,尤其是再次編輯,點(diǎn)擊后可以將指令回顯到輸入框內(nèi),減少用戶的操作成本。

AI回答:包括復(fù)制、重新生成、贊、踩、刪除等常駐功能,不同產(chǎn)品間一定差異性,如文檔類的支持將回答生成文檔,從而促進(jìn)轉(zhuǎn)化?!钢匦律伞棺鳛樽罡邇?yōu)的功能,往往放在最左側(cè),與其它操作相互區(qū)分。

3)中斷操作

用戶有想要終止對話的場景,此時(shí)需要「停止生成」按鈕來結(jié)束對話氣泡繼續(xù)生成文字。

關(guān)于「停止生成」按鈕的使用,不同設(shè)備的有一定差異:

  • Web端:會在對話氣泡下展示停止btn,但由于下滑位移btn會逐漸下移,不易操作,所以最保險(xiǎn)的方式是輸入框上方展示停止btn,并設(shè)定安全距離,保證視覺上的平滑。
  • 移動(dòng)端:屏幕的尺寸較小,會選擇節(jié)省空間的方式,如將原本的發(fā)送Btn,變?yōu)橥V筨tn。

6. 生成過程交互

AI助手工具的結(jié)果生成過程應(yīng)注重用戶的實(shí)時(shí)反饋、結(jié)果的清晰展示和優(yōu)化建議的提供,同時(shí)確保生成過程的可中斷性和停止后的資源清理等細(xì)節(jié)問題。這樣可以提升用戶的使用體驗(yàn),提高AI助手工具的效率和可用性。

1)生成中

即時(shí)反饋:在生成過程中,AI助手工具應(yīng)該提供即時(shí)的反饋,讓用戶了解當(dāng)前的生成進(jìn)度。例如:進(jìn)度條、IP動(dòng)畫或文字提示。同時(shí)會反饋會拆分成兩個(gè)階段。首先是AI識別的過程,反饋AI正在識別用戶問題,可以外顯AI查詢知識庫的行為,如“參考了10篇文章”,提升答案的可信度。其次是結(jié)果反饋的過程,AI將生成的結(jié)果逐步反饋給用戶。

可中斷性:生成過程中應(yīng)允許用戶隨時(shí)中斷,滿足用戶發(fā)現(xiàn)不需要繼續(xù)生成或想修改的訴求。

避免干擾:生成中的界面應(yīng)避免過多的干擾元素,如輸入框置灰不再支持輸入新內(nèi)容,讓用戶能夠?qū)W⒂谏蛇^程和結(jié)果。

2)生成后

結(jié)果展示:生成完成后,AI助手應(yīng)清晰、準(zhǔn)確地展示生成結(jié)果。如文本類,考慮文字的可讀性,如分段、關(guān)鍵文字加粗等要求,設(shè)計(jì)師要規(guī)劃好文字場景下富文本的展示規(guī)范。或是圖像類,考慮多圖排版的策略,以及超出極限值的折疊或者分頁展示策略。

操作反饋:對話氣泡會展示操作區(qū)域,幫助用戶對回復(fù)內(nèi)容完成操作。

用戶反饋:鼓勵(lì)用戶提供對生成結(jié)果的反饋,以便AI助手不斷優(yōu)化和改進(jìn)生成效果。往往通過贊和踩的方式收集用戶反饋,如果想收集更深入的內(nèi)容,也可在操作后調(diào)起調(diào)查問卷。

優(yōu)化建議:基于用戶反饋和算法評估,AI助手可以給出優(yōu)化建議,幫助用戶改進(jìn)輸入條件或調(diào)整生成參數(shù),以獲得更好的生成效果,如上文提到的“猜你想問”或“你可以這么問”。

3)停止生成

保存進(jìn)度:在停止生成時(shí),AI助手應(yīng)能夠保存當(dāng)前的生成進(jìn)度和結(jié)果,以便用戶后續(xù)繼續(xù)生成或編輯。

提示信息:停止生成后,AI助手可以給出相應(yīng)的提示信息,如“生成已停止”、“結(jié)果已保存”等,以便用戶了解當(dāng)前狀態(tài)。

操作引導(dǎo):停止生成后,應(yīng)該反饋下一步的操作,如「重新生成」。

7. 語音通話

除了以文本為主的對話界面,很多AI助手都上線了語音通話功能,可以更便捷地滿足一些化的場景。

1)通話流程

這個(gè)功能來源于手機(jī)語音通話,功能使用流程大同小異,可以拆解大概為:①啟動(dòng)-②連接-③人輸出-④AI識別-⑤AI輸出-⑥結(jié)束。

語音通話功能一般獨(dú)立于對話界面,通常以電話icon的形式作為入口,點(diǎn)擊啟動(dòng)語音通話。

連接是功能初始化的過程,AI識別則用于信息處理和回答生成,識別速度越快越接近真人語音通話體驗(yàn)。

一個(gè)完整通話通常是③④⑤往復(fù)循環(huán),至于接聽后是人先說還是AI先說,因產(chǎn)品而異。

2)關(guān)鍵要素

相比真人語音通話,對話對象真人變成了AI助手,帶來兩個(gè)明顯的特征:

  1. AI不會搶話。所以在人輸出的時(shí)候,需要告訴AI“我說完了”。這個(gè)“我說完了”可以是AI自動(dòng)識別的(通常根據(jù)用戶停頓時(shí)間識別),也可以是用戶手動(dòng)操作的(通常是點(diǎn)按發(fā)送)。
  2. 人也無法搶話。也就是說人無法在AI輸出的時(shí)候同時(shí)說話。目前不確定是技術(shù)限制還是產(chǎn)品設(shè)定,總之即使要和AI吵架也要等對方說完再說,文明了許多(笑)。當(dāng)然,各產(chǎn)品還是設(shè)計(jì)了“打斷”功能,可以立即讓AI閉嘴,換用戶自己說。

無論是“我說完了”還是“打斷”(尤其是“打斷”),都造成了與真人通話顯著的體驗(yàn)差異,使本可以解放雙手的功能變得有些雞肋。期待各AI廠商早日優(yōu)化。

同樣基于上述兩點(diǎn),界面狀態(tài)與提示就變得更為重要,以下是一些示例:

  • 狀態(tài)提示:連接初始化時(shí)、信號不良時(shí)。
  • 人說話前:引導(dǎo)用戶說話,如果有IP則作出期待的動(dòng)作,同時(shí)提示“請說,我在聽呢”。
  • 人說話時(shí):主要是聲波動(dòng)效,如果有IP則作出傾聽的動(dòng)作,或者提示“我正在聽”或“點(diǎn)按可發(fā)送”。
  • 人說話停頓時(shí):主要是聲波消失,同時(shí)提示自動(dòng)發(fā)送或點(diǎn)按發(fā)送。
  • AI識別時(shí):若識別時(shí)間長會帶來體驗(yàn)的間斷,需要給用戶明確的反饋和提示,降低這種感覺,同時(shí)允許用戶退出,提示可中斷此過程。
  • AI說話時(shí):AI發(fā)出聲音就是最直接的反饋,如有IP則作出說話的狀態(tài),同時(shí)給出用戶提示“可點(diǎn)擊打斷”。

對于整個(gè)語音通話功能,還有必備的掛斷鍵(點(diǎn)擊結(jié)束通話)、暫停/繼續(xù)鍵(通話中止/繼續(xù)),以及通話結(jié)束后的對話文本詳情。不同的產(chǎn)品還有些特色功能,如使用IP形象擬真(豆包)、實(shí)時(shí)字幕(文心一言)、角色選擇(訊飛星火)等。

總體來說,各家產(chǎn)品設(shè)計(jì)都大同小異。在交互細(xì)節(jié)上有些差異,也還有提升空間。比如狀態(tài)動(dòng)效的表意性、狀態(tài)動(dòng)效與提示的對應(yīng)性、語義的簡潔與易理解性等。

二、設(shè)計(jì)原則

基于AI助手的特點(diǎn)和概念設(shè)計(jì)要素,可歸納出生成式AI助手產(chǎn)品的八條設(shè)計(jì)原則,對于其他AI助手產(chǎn)品也同樣適用。

1. 自然語言處理能力的可視化

原則:確保用戶清楚地知道AI助手對他們的指令有所回應(yīng),并展示出理解能力。

實(shí)現(xiàn):當(dāng)用戶輸入后,AI助手立即給出回應(yīng),即使未生成答案,也會顯示運(yùn)行狀態(tài),例如顯示“意圖分析中…”、“正在聯(lián)網(wǎng)查詢…”等信息。

2. 上下文感知和連貫性

原則:AI助手需要保持對話的上下文,確?;貜?fù)的連貫性和相關(guān)性。

實(shí)現(xiàn):在對話框中,顯示上下文歷史或關(guān)鍵對話節(jié)點(diǎn),讓用戶可以隨時(shí)回顧并理解AI的連續(xù)回應(yīng)。例如,顯示過去幾輪對話的摘要,或者提供“你剛才提到…”的提示。

3. 多模態(tài)交互

原則:支持多種輸入輸出形式,滿足不同用戶需求和使用場景。

實(shí)現(xiàn):在同一個(gè)對話框中,允許用戶切換或組合使用語音、文本、圖片等多種輸入方式,AI助手也能以文字、語音、圖片、視頻、地圖等形式回復(fù)。例如,在文本對話中插入地圖卡片或視頻播放窗口。

4. 即時(shí)反饋與確認(rèn)

原則:在AI助手執(zhí)行操作或提供信息前后,及時(shí)給予用戶反饋和確認(rèn)。

實(shí)現(xiàn):用戶發(fā)出語音指令時(shí),顯示即時(shí)的文本轉(zhuǎn)換和理解反饋。例如,輸入框中實(shí)時(shí)顯示語音轉(zhuǎn)文字的內(nèi)容,并在理解后用不同顏色或下劃線標(biāo)注關(guān)鍵詞。

5. 個(gè)性化與定制化

原則:根據(jù)用戶歷史行為和偏好,提供個(gè)性化的建議和回復(fù)。

實(shí)現(xiàn):在對話中顯示個(gè)性化選項(xiàng)或快捷回復(fù),基于用戶的歷史使用情況和偏好進(jìn)行調(diào)整。例如,“根據(jù)你過去的選擇,我推薦你這次也選擇這個(gè)選項(xiàng)”。

6. 透明性與可解釋性

原則:讓用戶了解AI助手的工作原理,增加信任度。

實(shí)現(xiàn):提供解釋功能,當(dāng)AI助手給出復(fù)雜的建議或決策時(shí),用戶可以點(diǎn)擊查看詳細(xì)的解釋或背后的邏輯。例如,在提供健康建議時(shí),AI助手可以解釋數(shù)據(jù)來源和分析方法。

7. 誤差處理與糾錯(cuò)機(jī)制

原則:有效處理誤解或錯(cuò)誤,并允許用戶輕松糾正。

實(shí)現(xiàn):在對話中嵌入糾錯(cuò)按鈕或指令,讓用戶可以快速更正AI的誤解。例如,當(dāng)AI助手誤解用戶的指令時(shí),提供“重新生成”按鈕,讓AI助手重新理解,或提供問題文本復(fù)制按鈕,讓用戶修改問題。

8. 情感理解與反饋

原則:通過情感識別技術(shù),使AI助手更具人性化和情感關(guān)懷。

實(shí)現(xiàn):在對話中,AI助手可以識別并響應(yīng)用戶的情感,例如在用戶表達(dá)沮喪時(shí)提供安慰或鼓勵(lì)。界面上可以顯示情感標(biāo)識或提示,幫助用戶感知AI的理解。

作者:李祖威、韓筱婷

本文由人人都是產(chǎn)品經(jīng)理作者【58UXD】,微信公眾號:【58UXD】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 想請問一下 那幾個(gè)設(shè)計(jì)原則是來源于哪里呢

    來自浙江 回復(fù)