2025生成式AI平臺交互體驗觀察(大語言模型篇)

0 評論 1184 瀏覽 8 收藏 21 分鐘

過去一年,大模型產(chǎn)品百花齊放,都開始卷價格和應(yīng)用,對用戶來說當然是好事。但就實際上手來說,這些產(chǎn)品的表現(xiàn)怎么樣?這篇文章,我們來看看作者的分析。

The world is changing,it’s time we change too.

2024年是AI應(yīng)用元年,從2023年ChatGpt爆火到國內(nèi)百模大戰(zhàn),到現(xiàn)在AI技術(shù)應(yīng)用在C端、B端百花齊放,新一代互聯(lián)網(wǎng)商業(yè)模式MaaS(Model as a Service模型即服務(wù))應(yīng)運而生。

盡管AI應(yīng)用很新潮,過去我們積累的用戶體驗設(shè)計經(jīng)驗也未必不管用。過去一年,我們看到了很多基于大語言模型的產(chǎn)品百花齊放,我想聊聊我的觀察。

一、找到切入點

AI產(chǎn)品很多,功能很復(fù)雜,我們需要找到一個切入點,我想從黑箱理論說起。

蘋果公司的黑箱理論:用戶不需要了解系統(tǒng)或功能背后的實現(xiàn)邏輯,只需要關(guān)注呈現(xiàn)在用戶眼前的交互界面即可。

很有意思的是,大語言模型從技術(shù)上來說本身就存在黑盒特性,這些模型的內(nèi)部工作機制常常對我們而言就是一個“黑盒”。雖然這些模型的代碼、參數(shù)和訓(xùn)練方法是公開透明的,但我們?nèi)匀浑y以追蹤和理解它們?nèi)绾螐奶囟ǖ妮斎肷商囟ǖ妮敵觥?/p>

這種復(fù)雜性源自于模型內(nèi)部多層次的非線性數(shù)據(jù)處理和海量參數(shù)的復(fù)雜交互,使得追溯和理解其決策路徑成為一項巨大挑戰(zhàn)。

就像人類決策是由復(fù)雜的情感、多重動機和豐富的個人經(jīng)驗交織而成的。AI模型同樣如此,盡管我們了解它們的基礎(chǔ)架構(gòu)(類似于人類的基因)和訓(xùn)練過程(類似于人類的教育和經(jīng)歷),但模型如何綜合這些因素以做出特定響應(yīng)仍是復(fù)雜且難以預(yù)測的。

基于此,從黑盒理論和用戶的角度出發(fā),大語言平臺本質(zhì)上可以看成三個模塊,輸入模塊-分析模塊-輸出模塊,由此我們就有了相對直觀的觀察角度。

二、輸入模塊

輸入通俗地講叫向大語言模型提出“問題”,比較專業(yè)的說法叫“提示”或“指令”,也有一個專門的工程類別叫“提示工程”;是將信息輸入到大模型中的必要前提。

很多時候一個好提示將決定結(jié)果的輸出質(zhì)量,并且一個問題經(jīng)常是需要多次迭代才能生成最終的結(jié)果,用戶的真實想法往往和實際意圖之間差了好遠。

吳恩達在《給每個人的大語言模型課》中說:“我不認為有一個適合每個人的完美提示,用戶選擇輸入有一個從“想法”到“提示工程”到“模型回復(fù)”的過程,更有用的是有一個流程,當我自己在使用大模型時,經(jīng)常會嘗試和迭代,比如如果我不喜歡結(jié)果,我可能會澄清,如果仍沒有給我想要的確切結(jié)果,我可能會進一步進行澄清和迭代?!?/p>

在輸入模塊,提升用戶體驗的核心點就在于如何更高效地幫助用戶從一個想法,不斷優(yōu)化提示,使其更快速地接近所需答案的過程。

國內(nèi)外生成式AI技術(shù)平臺為此做了很多的努力。輸入本身是有成本的,我根據(jù)用戶痛點,對大語言模型平臺的核心功能點進行了梳理。

降低輸入成本

OK,小朋友們,讓我們回到小時候的語文課堂,當我們在描述一件事情的時候,通常會遵循5W1H原則,即什么人在什么時間點在哪里做了什么事情,是如何做的,為什么做。

同樣的,在向大語言模型輸入提示的時候,我們依然可以遵循這樣的原則。


但往往,可能是因為在真實的社交場景中,人與人在互相交流前就已經(jīng)事先共享了一部分信息,在描述事情的時候也不需要那么全面。

大語言模型盡管由海量的數(shù)據(jù)訓(xùn)練出來,但面對單個用戶時,雙方其實并沒有事先共享信息。所以幫助用戶降低輸入成本就比較重要。下面是部分解決辦法:

主動理解意圖

當面對交談的對象語無倫次,東一榔頭西一棒槌地描述的時候,我們會反問:“你想說的是不是這個…意思?”。

在輸入模塊,平臺幫助用戶做的也是這么一件事情:你想表達的東西,我?guī)湍惚磉_一部分,你看看是不是這個意思。下面我會舉例:

ChatGpt的對話框下提供了多個用戶常見的場景,創(chuàng)建圖片|給我驚喜|總結(jié)文本|分析輸入|分析圖片|幫我寫等。點擊之后推薦對應(yīng)場景的聯(lián)想問題來幫助完善提問。

用戶選擇代替用戶輸入

豆包和文心一言甚至更貼心地把常用技能模塊細分到更加具體的使用場景,進一步明確用戶的目標,事先提供對應(yīng)場景的功能,并且提供對話模版,用戶只需要在對應(yīng)窗格中填充文字即可。

Copliot在界面上提供各式各樣的主題卡片,教育用戶如何提問。

Kimi在輸入關(guān)鍵詞時向用戶推薦更加全面的相關(guān)的提示詞參考,提前理解用戶意圖。并且在后續(xù)的生成結(jié)果中,繼續(xù)提供用戶可能會提問的問題來引導(dǎo)用戶。

增加輸入?yún)⒖?/h3>

當有些信息無法用簡短的語言描述時,比如圖片、文檔、網(wǎng)頁,最簡單直接的辦法就是直接上傳上去,作為輸入的附加參考。

用戶只需說:“參考這個內(nèi)容幫我做XXXX事情”,這些附件內(nèi)容會和文本信息會一起送進大模型黑盒里去。如今上傳文件,上傳圖片,聯(lián)網(wǎng)搜索,語音輸入已經(jīng)成為了生成式AI平臺的標配功能。

自定義智能體

除此之外,盡管大模型很通用,在對話時,對于特定領(lǐng)域的業(yè)務(wù),還是需要針對不同的屬性進行定制化,讓大語言模型先有一個明確的自我定位;比如是一個數(shù)據(jù)分析專家,或是健身教練,也可能是多角色的集合體AIAGent。

ChatGpt的探索模塊支持使用并創(chuàng)建自己的智能體,針對特定的使用場景:提高效率|體驗交流|價值創(chuàng)造提供多種多樣的自定義版本的智能體。

Kimi+針對辦公提效|輔助寫作|社交娛樂|生活實用的特定場景提供各種各樣的智能體。同樣類似的還有文心一言、360AI、通義千問等。

而豆包比較有趣,在網(wǎng)頁端,還比較正經(jīng),推薦了一些跟提效創(chuàng)作有關(guān)的智能體。

而到了手機端,豆包自己本身變成了一個幾乎和其他智能體權(quán)重平等的應(yīng)用,發(fā)現(xiàn)頁中推薦了各種各樣的情緒體驗型智能體,主打和各種各樣的明星和數(shù)字人聊天、打電話、談戀愛、玩游戲,獲得陪伴體驗。

在集體AI平臺都在卷AI硬知識技能時,豆包選擇了將AI和娛樂掛鉤起來,讓AI產(chǎn)品變得有趣,在年輕人的荷爾蒙中發(fā)酵,這是互聯(lián)網(wǎng)流量思維的玩法。

三、分析模塊

在分析模塊,當前主流大模型盡管在語言理解和文本生成上表現(xiàn)優(yōu)異,但仍然在一些方面體驗不佳:大模型回復(fù)等待時間長;不允許打斷、插話;存在幻覺等。我將從這三點聊聊體驗設(shè)計在其中的應(yīng)用。

減少等待焦慮

在過去的加載頁面等待研究中,我們有這樣的共識:用戶等待頁面加成功時的耐心程度一般在2-3秒范圍內(nèi),GooGle研究顯示,大約53%的移動設(shè)備用戶會在加載超過3秒時離開,每增加1秒延遲,用戶轉(zhuǎn)化率可能下降7%或更多,過長的等待時間會讓用戶感到不耐煩。

耐心時間范圍

  • 0-2秒:最佳用戶體驗,加載速度快的頁面會顯著提升用戶滿意度。
  • 3-5秒:用戶的注意力開始下降。如果加載時間超過這一范圍,可能會導(dǎo)致用戶放棄。
  • 6秒以上:用戶放棄的可能性顯著增加。研究顯示,大約53%的移動設(shè)備用戶會在頁面加載超過3秒時離開。

因此,過去如果系統(tǒng)加載慢,用戶體驗師會設(shè)計加載動畫或進度條,優(yōu)先加載關(guān)鍵內(nèi)容等方式來延長用戶耐心,生成式AI平臺也通過類似的方法來提升用戶體驗。

ChatGPT通過逐步每次都將生成的部分內(nèi)容展示出來,使用戶可以邊閱讀部分邊生成來延長用戶的忍耐程度。如果你在python中調(diào)用過大模型的API的話,大模型只會在生成所有文本后返回結(jié)果。你會發(fā)現(xiàn)大模型在生成長文本的時間其實還蠻長的。

通義千問和秘塔搜索通過展示加載分段式進度條來告知用戶任務(wù)完成程度,降低時間感知,避免不確定等待。進度條的存在也能顯示系統(tǒng)正在正常工作,增強用戶對平臺的信任。

Gemin通過logo動畫,更加自然的淡入淡出刷新文字的加載動畫,來進一步體現(xiàn)所搭載的大語言模型性能

提供打斷工具

不允許打斷插話這一點當前業(yè)內(nèi)普遍做法都是提供停止輸出工具,功能大多也大同小異。

不過最新的ChatGpt提供的畫布模式,支持了對分析結(jié)果的具體內(nèi)容進行進一步地編輯,引導(dǎo)用戶進一步細化結(jié)果。

強化安全意識

由于大模型的黑箱特性,盡管RAG等數(shù)據(jù)投喂技術(shù)在一定程度上減少了大模型的幻覺,但當前業(yè)界最好的大模型推理一致性在97%左右,幻覺度約3%,距離ToB/ToH領(lǐng)域的規(guī)模應(yīng)用,如網(wǎng)絡(luò)規(guī)劃、儀表和電器精準控制尚有差距。故AI生成能力本身的可信任度依然是需要擔憂的事情。為此,在用戶體驗層面,設(shè)計的核心點在于增加大模型生成結(jié)果的客觀性。

降低信任預(yù)期

大模型需要告訴用戶生成的內(nèi)容僅具有參考性,也可能會犯錯,通常會在界面對話框底部強調(diào)。

增加生成內(nèi)容客觀性

通過RAG、LanGChain等技術(shù)與搜索引擎結(jié)合,從多個來源提取關(guān)鍵信息,實時檢索和驗證,生成綜合性的回答,減少“幻覺”現(xiàn)象,提升答案的準確性和可信度。

四、輸出模塊

在輸出模塊,我想聊聊大模型的記憶、反饋、多模態(tài)輸出的體驗設(shè)計。

記憶

如果用python調(diào)用過大模型的API的話,我們會意識到大模型本身是沒有記憶的。但是在與用戶的對話中,平臺會將當前會話的上下文信息作為輸入模型的一部分,利用注意力機制處理這些信息,從而生成與上下文相關(guān)的響應(yīng),使得模型能夠在單詞對話中保持對近期信息的記憶,從而提供連貫的回答。

然而,大模型的上下文窗口長度是有限的,通常在數(shù)千個標記(toKens)范圍內(nèi)。這意味著當對話長度超過上下文窗口的容量時,早期的信息可能會被遺忘或忽略。技術(shù)層面研究人員為此提出了多種方法來增強模型的記憶能力。比如循環(huán)記憶、引入外部存儲機制等,但仍然存在一定的局限性。

于是我觀察到了針對這一場景的體驗設(shè)計:

ChatGpt提供了歸檔功能,通過歸檔功能,ChatGpt可以記住用戶在之前對話中的偏好、習(xí)慣或重要信息(如興趣愛好、工作方向),從而更接近用戶的需求。

Kimi/通義千問/文心一言則通過設(shè)置常用語功能來應(yīng)對可能出現(xiàn)短期記憶突然失效的情況。

反饋

說了這么多,生成式AI平臺的核心競爭力說到底依然是大模型本身的推理能力,如今的大模型依然容易繼承和放大訓(xùn)練數(shù)據(jù)中存在的偏差,AI大模型難以避免會寫出看似合理但不正確或荒謬的答案。大模型開發(fā)過程中很重要的環(huán)節(jié)是數(shù)據(jù)標注,會耗費大量的人力物力,ChatGpt的問世離不開背后大量工程師對模型數(shù)據(jù)微調(diào)校正標注的努力。

同時,AI平臺的模型能力的增強也需要用戶的反饋,通過每天用戶海量的生成結(jié)果,從反饋給平臺以進一步優(yōu)化模型推理能力。越強推理能力的大模型平臺擁有越多的用戶,越多的用戶越增強大模型推理平臺的能力。

而這個反饋入口就在輸出結(jié)果的下方,用戶可以點擊喜歡/不喜歡進行問題反饋,幾乎所有的AI平臺都有這個看似不起眼,但非常重要的功能。

多模態(tài)輸出

盡管可能我們認知里的大語言模型平臺更多是專注于文本類型輸出,我觀察到國內(nèi)外很多的大模型平臺都在往多模態(tài)生態(tài)方向打造,大語言模型正在和文生圖、數(shù)字人、機器人、文生視頻、內(nèi)容理解、文本處理、社區(qū)等功能融合。背后的邏輯比較復(fù)雜,我將在下一個模塊再聊。

總結(jié)

AI的發(fā)展雖然很快,但也是經(jīng)歷了漫長的過程,再偉大的創(chuàng)新,也會基于人們過往經(jīng)驗的總結(jié)。技術(shù)再強大,也是服務(wù)于人的,AI應(yīng)用的風在互聯(lián)網(wǎng)上吹了一陣又一陣,但殺手級的AI應(yīng)用到目前為止仍未出現(xiàn);場景不夠匹配,AI的局限性依然是擋在AI應(yīng)用路上的大山。

作為一個從業(yè)4年的交互設(shè)計師,我的心情無比復(fù)雜,不知道多少人和我一樣,眼看著所謂的大機遇就在眼前,但自己卻無力乘風,內(nèi)心無比焦慮。外面都在說AI將顛覆整個互聯(lián)網(wǎng),又說所有的互聯(lián)網(wǎng)產(chǎn)品都可以用AI重做一遍,擔心自己的飯碗不保,擔心自己跟不上時代的浪潮。但要我說,人們在面對未知時總是會放大恐懼,這些都不必過分擔心。

丘吉爾有一句話:如果你到了地獄,那就繼續(xù)保持前行。

讓我們繼續(xù)前行吧,朋友!

本文由 @為美好而設(shè)計 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!