AI 產(chǎn)品交互的演進(jìn):新興趨勢(shì)和洞察

wanlinguo
0 評(píng)論 1233 瀏覽 1 收藏 12 分鐘
🔗 产品经理的职业发展路径主要有四个方向:专业线、管理线、项目线和自主创业。管理线是指转向管理岗位,带一个团队..

從語(yǔ)音、視覺到多模態(tài)交互,從靜態(tài)界面到動(dòng)態(tài)自適應(yīng)設(shè)計(jì),AI 交互正在經(jīng)歷一場(chǎng)深刻的變革。本文將深入探討 AI 產(chǎn)品交互的新興趨勢(shì),以及低代碼和無代碼 AI 集成的發(fā)展,供大家參考。

隨著ai 產(chǎn)品 增長(zhǎng)和創(chuàng)新的井噴爆發(fā),在新推出的ai 產(chǎn)品上,我們也看到了新的交互形態(tài)。ai 對(duì)交互的要求,技術(shù)和工具的賦能,使交互設(shè)計(jì)在個(gè)性化,多模態(tài) 和自適應(yīng)擬真 等層面不斷更迭。許多ai 初創(chuàng)公司也在新型交互上呈現(xiàn)了新的探索和嘗試。

語(yǔ)音視覺多模態(tài)交互與情景自適應(yīng)

多模態(tài)交互能力

下一代人工智能界面有望超越基于文本的交互更多實(shí)現(xiàn)多模態(tài)交互能力:

  • 先進(jìn)的語(yǔ)音和語(yǔ)音識(shí)別
  • 具有增強(qiáng)情感智能的自然語(yǔ)言處理
  • 視覺和手勢(shì)輸入集成
  • 不同交互模式之間的無縫轉(zhuǎn)換

情境性和自適應(yīng)界面

人工智能界面的未來正在超越靜態(tài)交互,走向更加動(dòng)態(tài)和情境感知的體驗(yàn)。許多ai 初創(chuàng)公司正在探索能夠:

  • 根據(jù)用戶上下文和偏好動(dòng)態(tài)調(diào)整
  • 提供基于實(shí)時(shí)理解的個(gè)性化交互
  • 跨多個(gè)平臺(tái)和設(shè)備無縫集成

Vapi (https://www.vapi.ai)

圖片來自voiceAI官網(wǎng)

對(duì)于復(fù)雜的工作流配置功能,以畫布形式呈現(xiàn)產(chǎn)品工作流,為用戶提供一目了然的畫面感,成為ai 交互產(chǎn)品中的一種主要交互模式。以ai 初創(chuàng)公司 vapi 為例,這是一款面向開發(fā)者的ai 工具,他們的使命是voice AI for developers,幫助開發(fā)者在短時(shí)間內(nèi)高效創(chuàng)建,測(cè)試和部署語(yǔ)音agent。這個(gè)產(chǎn)品面向的關(guān)鍵用戶是希望在自己的移動(dòng)應(yīng)用中集成語(yǔ)音助手(voice agent )的開發(fā)者。在與agent 對(duì)話過程中,ai 對(duì)提問者中斷的反應(yīng)

考慮到在語(yǔ)音交互,信號(hào)接收以及反饋的過程中,用戶對(duì)語(yǔ)音交互的延遲感知非常敏感,對(duì)語(yǔ)音交互延遲的感知細(xì)化到了毫秒級(jí)別(millisecond),也就是對(duì)反應(yīng)延遲的控制精度要求。

更近一步,在語(yǔ)音交互過程中,ai 可以通過實(shí)時(shí)學(xué)習(xí)對(duì)話內(nèi)容,自適應(yīng)應(yīng)答。例如,用戶a在跟ai 的對(duì)話中被用戶b打斷,那么ai 會(huì)自動(dòng)識(shí)別對(duì)話者的切換并且在接下來的對(duì)話中進(jìn)行調(diào)整。

Retell AI (https://www.retellai.com)

華人創(chuàng)始團(tuán)隊(duì)的ai公司retall ai提供了ai 語(yǔ)音客服服務(wù),并且能夠根據(jù)用戶所在場(chǎng)景自適應(yīng)調(diào)整交互模式和對(duì)話內(nèi)容。官網(wǎng)目前支持的場(chǎng)景包含商機(jī)管理,前臺(tái)接待人員,調(diào)研,客服,催收等等。同時(shí)在交互中實(shí)時(shí)進(jìn)行自適應(yīng),例如,在識(shí)別出對(duì)話對(duì)象處于休假狀態(tài)的時(shí)候,會(huì)根據(jù)休假場(chǎng)景自動(dòng)作出回應(yīng)。

無限畫布重構(gòu)ai 交互

在新興ai初創(chuàng)中,我們同時(shí)也看到無限畫布的交互方式在不同ai 產(chǎn)品中被作為主流交互模式,例如to c 的新一代ai 創(chuàng)作工具flowith 和to b 工作流自動(dòng)化產(chǎn)品。

Flowith.ai 作為新一代ai 創(chuàng)作工具,其愿景是Craft the ultimate vessel for super intelligence,致力于打造無縫的ai 集成產(chǎn)品。Flowith引入畫布借助于ai 完成了低延時(shí)的準(zhǔn)實(shí)時(shí)交互,同時(shí)也體現(xiàn)了畫布設(shè)計(jì)的關(guān)鍵優(yōu)勢(shì):

a.協(xié)助用戶完成多線程思維:用戶可以進(jìn)行多個(gè)思考分支,實(shí)現(xiàn)并行設(shè)計(jì),創(chuàng)作和思維拓展

b.視覺化組織:任何內(nèi)容和工作流設(shè)計(jì)通過視覺化呈現(xiàn)而非線性或者文本堆疊

c.上下文內(nèi)容追蹤:每個(gè)節(jié)點(diǎn)關(guān)系清晰可見,交互進(jìn)度克追蹤,解決了傳統(tǒng)對(duì)話中上下文丟失的問題

Gumloop(https://www.gumloop.com)

公司愿景是10倍加速ai 工作流自動(dòng)化,無代碼。作為一個(gè)工作流設(shè)計(jì)系統(tǒng),cavas 畫布成為最核心的交互形式。其交互重點(diǎn)在于,通過視覺化的畫布更好呈現(xiàn)了agent 工作流。

Gumloop 同時(shí)提供多種主流數(shù)據(jù)源和數(shù)據(jù)格式的對(duì)接,包括google 辦公軟件,主流筆記產(chǎn)品notion,slack等協(xié)作工具。

圖片來自gumloop 官網(wǎng)

AnswerGrid – answer at scale

在搜索和對(duì)話交互中提供用戶友好的提示語(yǔ)樣本

多模式和交互性表格設(shè)計(jì)- 為每一個(gè)表格提供獨(dú)立代理

對(duì)每一個(gè)動(dòng)作按鈕進(jìn)行明確清晰的定義

確保所有相關(guān)數(shù)據(jù)源呈現(xiàn),這對(duì)打造用戶信任度非常重要。用戶可以信賴agent 通過數(shù)據(jù)源處理的結(jié)果,例如相關(guān)的引用和鏈接等等

在專業(yè)領(lǐng)域的ai 產(chǎn)品設(shè)計(jì)中,對(duì)話過程中友好的prompt 提示顯得非常重要

以初創(chuàng)公司AnswerGrid 為例,在大批量對(duì)話交互中,實(shí)時(shí)給用戶提供提示語(yǔ)(prompt模版)

通過自適應(yīng)ui 調(diào)整來滿足個(gè)體用戶的個(gè)性化需求

表格化agent的交互界面,呈現(xiàn)給用戶的不僅有agent 結(jié)果,也有每一個(gè)結(jié)果的數(shù)據(jù)來源:

圖片來自Answer grid官網(wǎng)

專業(yè)領(lǐng)域界面

與通用解決方案不同,趨勢(shì)是走向高度專業(yè)化,增強(qiáng)智能化的人工智能界面,重點(diǎn)從替代轉(zhuǎn)向增強(qiáng):醫(yī)療、金融、教育等行業(yè)特定界面,能夠增強(qiáng)人類能力的人工智能界面。

  • 與人類并肩工作的協(xié)作系統(tǒng)
  • 能夠理解特定領(lǐng)域詞匯和工作流程的定制體驗(yàn)
  • 可以快速適應(yīng)特定專業(yè)或個(gè)人使用場(chǎng)景的
  • 提供智能建議和決策支持的界面

ai 代理自主規(guī)劃于執(zhí)行:自主規(guī)劃,任務(wù)分解,無限工具調(diào)用,自我優(yōu)化

Hebbia.AI 是一家文檔處理公司,給不同行業(yè)(金融,法律,大企業(yè))提供文檔分析和處理模版,在分析表格為主的界面上實(shí)現(xiàn)金融盡職調(diào)分析,法律文件分析,企業(yè)監(jiān)管文件分析、PDF 以及音頻和視頻剪輯,以幫助專業(yè)領(lǐng)域的客戶處理垂直行業(yè)場(chǎng)景的查詢和分析

Polymet.AI提供了行業(yè)ai 產(chǎn)品設(shè)計(jì)工具,例如醫(yī)療保險(xiǎn)行業(yè)。在產(chǎn)品設(shè)計(jì)上考慮交互背后的邏輯,在生成提示的時(shí)候保持用戶交互持續(xù)性,例如在時(shí)長(zhǎng)過久的時(shí)候提示用戶10分鐘后返回結(jié)果。產(chǎn)品生成prompt 的同時(shí)提供了不同的設(shè)計(jì)要素供用戶選擇。

 

 

圖片來自Polymet.AI官網(wǎng)

低代碼和無代碼人工智能集成

人工智能界面開發(fā)將越來越拉進(jìn)技術(shù)與非技術(shù)用戶的距離,代碼生成的自動(dòng)化將允許非技術(shù)用戶自定義創(chuàng)建人工智能界面。典型的交互方式有拖放的人工智能界面構(gòu)建工具,提供模塊化的人工智能組件庫(kù)。

無代碼AI平臺(tái)通過降低人工智能實(shí)施的門檻提供了顯著的優(yōu)勢(shì)。它們使業(yè)務(wù)用戶、分析師和領(lǐng)域?qū)<夷軌騽?chuàng)建AI驅(qū)動(dòng)的解決方案,而無需深入的技術(shù)專業(yè)知識(shí)。這種民主化可以加速數(shù)字化轉(zhuǎn)型,惠及那些可能缺乏資源構(gòu)建定制AI解決方案的組織和行業(yè)。

最好的無代碼AI產(chǎn)品在簡(jiǎn)單性和能力之間取得平衡。它們通常提供直觀的可視化界面、預(yù)建模板和拖放功能,同時(shí)仍然提供訪問強(qiáng)大的AI模型和工作流的能力。這種組合允許快速原型設(shè)計(jì)和部署可以提供真正業(yè)務(wù)價(jià)值的AI解決方案。

非常典型的無代碼平臺(tái)有cursor,瑞典公司lovable等。無代碼開發(fā)平臺(tái)+ 底層大模型已經(jīng)成為許多非技術(shù)用戶快速開發(fā)產(chǎn)品原型和上線的王牌工具組合。

圖片來自lovable官網(wǎng)

總而言之,ai界面交互趨勢(shì)的推動(dòng)要?dú)w公于多項(xiàng)技術(shù)發(fā)展:

  • 先進(jìn)的機(jī)器學(xué)習(xí)模型
  • 改進(jìn)的自然語(yǔ)言處理
  • 量子計(jì)算的進(jìn)步
  • 增強(qiáng)的神經(jīng)網(wǎng)絡(luò)架構(gòu)
  • 改進(jìn)的傳感器和輸入技術(shù)

挑戰(zhàn)與考慮

盡管ai 交互成為主流并且不斷革新,但是在倫理和安全層面還有層層挑戰(zhàn),如何緩解在人工智能系統(tǒng)中的偏見,保持以人為本的設(shè)計(jì),最終在倫理合規(guī),數(shù)據(jù)安全,技術(shù)能力和用戶體驗(yàn)之間取得平衡是必須持續(xù)突破的課題。

預(yù)測(cè)展望

人工智能界面的未來不僅僅在于創(chuàng)造更智能的系統(tǒng),而是創(chuàng)造更以人為本、更具適應(yīng)性和情境感知的體驗(yàn)。最成功的界面將是那些能夠無縫融入用戶生活、理解其獨(dú)特需求,并在不造成復(fù)雜性的情況下提供價(jià)值的界面。我們可以預(yù)期人工智能界面在下一個(gè)十年將實(shí)現(xiàn)高度個(gè)性化,跨領(lǐng)域和平臺(tái)的集成,關(guān)注增強(qiáng)人類的潛能而非替代。

本文由 @wanlinguo 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
"="" class="meta">04-193515 瀏覽
"="" class="meta">
"="" class="meta"> "="" src="https://image.woshipm.com/wp-files/2023/04/RRf1iJKWY5AKXaw36juA.jpg!/both/120x80" alt="ChatGPT之所以火,是因?yàn)槲覀儽弧叭斯ぶ钦稀闭勰ヌ?>
="">
"="" src="https://image.woshipm.com/wp-files/2023/04/RRf1iJKWY5AKXaw36juA.jpg!/both/120x80" alt="ChatGPT之所以火,是因?yàn)槲覀儽弧叭斯ぶ钦稀闭勰ヌ?>