關(guān)于“AI對話中斷”場景的邏輯設(shè)計方法
相信在和AI產(chǎn)品對話的過程中,不少用戶都有過對話中斷的體驗,那么產(chǎn)品一側(cè),要如何做好中斷場景下的設(shè)計和交互,以滿足用戶的潛在訴求呢?這篇文章里,作者就做了梳理和分享,一起來看看吧。
一、用戶場景
用戶在與類ChatGPT的生成式AI產(chǎn)品進行對話和交互的過程中,可能因為某些原因,導致對話中斷,此時,數(shù)據(jù)的流轉(zhuǎn)邏輯和產(chǎn)品交互怎么設(shè)計才是比較好的方案呢?
中斷的場景有2類,主要劃分依據(jù)是是否切斷網(wǎng)絡(luò)、是否終止了數(shù)據(jù)傳輸和交互流程。
中斷場景①:網(wǎng)絡(luò)終端、刷新瀏覽器、關(guān)閉瀏覽器
- 該場景下,用戶主動或者被動中斷了與產(chǎn)品的網(wǎng)絡(luò)連接;
- 本文討論的范圍設(shè)定是:對話中的用戶已經(jīng)成功發(fā)送了問題,繼而中斷了網(wǎng)絡(luò)。
中斷場景②:切換瀏覽器頁簽、切換查看對話記錄
- 該場景下,用戶僅僅切換了屏幕顯示的畫面,并沒有切斷網(wǎng)絡(luò)和終止數(shù)據(jù)傳輸和交互流程;
- 可能存在長時間不停留在交互界面的情況。
(對話界面)
二、需求分析
根據(jù)上述的用戶使用場景,我們需要對用戶在該場景下的使用需求和交互心里進行進一步的分析。我們發(fā)現(xiàn),兩種場景都主動或被動打斷了用戶正常的對話路徑,讓用戶的使用體驗不流暢,產(chǎn)生了中斷、丟失、卡頓等情況,我們需要通過分場景的、合理的產(chǎn)品交互的設(shè)計,來幫助用戶完成交互動作,并且感受良好。
用戶對產(chǎn)品的述求可能如下:
- 中斷情況發(fā)生的時候,我需要明確感知情況有變;
- 中斷時的狀態(tài)和恢復后的狀態(tài)之間需要有銜接,讓用戶認知保持連貫性;
- 已經(jīng)交互的數(shù)據(jù),不能丟失,能快速被找到,能感受到產(chǎn)品的穩(wěn)定性。
三、產(chǎn)品目標
在對話式AI產(chǎn)品的交互中,這種主動或被動打斷了用戶正常的對話路徑的場景是普遍存在的,尤其是組件化和PC端的界面。
基于場景的梳理和用戶述求的分析,產(chǎn)品需要解決這個問題,并需要達到的目標有:
- 分場景梳理數(shù)據(jù)流轉(zhuǎn)關(guān)系;
- 分析數(shù)據(jù)邏輯,明確數(shù)據(jù)呈現(xiàn)方式;
- 分場景的交互流程;
- 用戶使用路徑的設(shè)計。
四、數(shù)據(jù)邏輯
1. AI對話的數(shù)據(jù)傳輸方式
當用戶需要使用GPT產(chǎn)品時,通常情況下,需要輸入一段文本,一旦用戶成功發(fā)送了“作為問題的這段文本”給到server,問題一次性提交給大模型。
而,大模型返回數(shù)據(jù)的方式是流式的,大模型逐步計算輸出,server逐字逐句輸出給到前端,前端再通過打字機效果展示給用戶。
在此過程中,用戶即便終端聊天,不終止大模型的數(shù)據(jù)輸出。
如下圖所示:
2. AI對話的數(shù)據(jù)保存方式
在一次用戶對話交互中,大模型完成所有內(nèi)容輸出后,本輪對話的完整數(shù)據(jù),server一次性提交并保存到DB(數(shù)據(jù)庫)。
業(yè)務(wù)數(shù)據(jù)庫的數(shù)據(jù),可以用于產(chǎn)品的前端展示和其他用途,也可以用于后臺產(chǎn)品的分析等。
3. AI對話的數(shù)據(jù)回顯方式
在不同場景下,數(shù)據(jù)回顯到用戶界面的方式不一樣。
- 正常界面對話:打字機效果逐字顯示;
- 對話中斷后:前端輪詢,獲取AI輸出的完整數(shù)據(jù),一旦獲取到,一次性全部展示在前端,非打字機效果;
- 中斷網(wǎng)絡(luò):可通過對話記錄,查看完整的數(shù)據(jù),一旦獲查看,一次性全部展示在前端,非打字機效果。
五、產(chǎn)品設(shè)計方案
1. 中斷場景①:網(wǎng)絡(luò)終端、刷新瀏覽器、關(guān)閉瀏覽器
- 此種場景下,網(wǎng)絡(luò)中斷,當前對話框關(guān)閉;
- 頁面刷新后,再次回到JiweiGPT,顯示新的對話框;
- 刷新or關(guān)閉前的對話窗口收入到對話記錄,可切換查看
- 用戶再次切回原對話記錄,能查看原提問的完整回答記錄。
2. 中斷場景②:切換瀏覽器頁簽、切換查看對話記錄
- 此種場景下,網(wǎng)絡(luò)未中斷,用戶未退出程序,只是不在當前屏幕上顯示觀看;
- 再次切換回當前對話,顯示原殘缺的不完整的數(shù)據(jù);
- 同時,不可以再次發(fā)送問題,AI輸出氣泡有l(wèi)oading,告知用戶AI正在輸出中;
- 此時,前端需要輪詢,請求服務(wù)端數(shù)據(jù)接口,一旦拉取到完整的回答數(shù)據(jù),一次性顯示在用戶端的氣泡;
- 此時,用戶能看到完整AI回答。
六、小結(jié)
通過以上兩個場景的需求分析和方案設(shè)計,本文提供了一個基于實踐的、有效的解決AI對話中斷的交互邏輯方案。
專欄作家
Echo 產(chǎn)品論,微信公眾號:產(chǎn)品經(jīng)理的邏輯與審美,人人都是產(chǎn)品經(jīng)理專欄作家。10年產(chǎn)品經(jīng)驗,多個0~1的完整產(chǎn)品經(jīng)歷,前好未來智能學習內(nèi)容產(chǎn)品專家,目前聚焦在AI領(lǐng)域,專研AIGC行業(yè)應(yīng)用產(chǎn)品落地研發(fā),對產(chǎn)品的邏輯和審美有獨到的思考。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
前端的效果可以是一次性給出,也可以打字機效果。大模型輸出內(nèi)容是流式的,準確地說是逐詞。
大語言模型使用的是一種稱為“自回歸”的技術(shù),其中模型逐個生成輸出文本中的每個詞,基于已經(jīng)生成的詞來預測下一個詞。這種技術(shù)允許模型在生成輸出時考慮整個句子或段落的上下文,從而生成更加連貫和準確的文本。
前端交互效果只是效果,你確定數(shù)據(jù)傳輸?shù)臅r候 是逐字傳輸?shù)穆???♂?
是的
我還跟我們的算法團隊確認了一下。你們竟然逐字傳輸…,只能說 666.66…6
算法說:兩種模式,一種是一次性給出全部答案,一種是逐詞給出
嗯,這兩種方式的優(yōu)缺點是啥?