淺談:YY直播平臺中內(nèi)容分發(fā)、自然語言對話NLP的人工智能AI

1 評論 9875 瀏覽 87 收藏 25 分鐘

本文是關(guān)于在直播平臺中內(nèi)容分發(fā)、自然語言對話的人工智能AI應(yīng)用。主要側(cè)重其定義、作用、實(shí)現(xiàn)方式,同時(shí)也拋出相關(guān)的資訊及案例進(jìn)行分析。這也是當(dāng)時(shí)面試歡聚YY AI產(chǎn)品經(jīng)理其中六輪面試中第三輪中一些問題的梳理總結(jié),后面拿下了這個(gè)Offer。(由于利益關(guān)系去掉了一些內(nèi)容)對AI產(chǎn)品經(jīng)理的相關(guān)面試和準(zhǔn)備有興趣的小伙伴,歡迎關(guān)注收藏,不斷更新。

本文目錄如下:

1. 內(nèi)容分發(fā)在直播平臺中的AI應(yīng)用

1.1 內(nèi)容的審核監(jiān)管

1.1.1先說:問題和風(fēng)險(xiǎn)

1.1.2再看:傳統(tǒng)的解決

1.1.3應(yīng)用改進(jìn):AI

1.2 個(gè)性化的內(nèi)容分發(fā)

1.2.1背景

1.2.2利用AI挖掘出內(nèi)容特征

2. 自然語言對話在直播平臺中的AI應(yīng)用

2.1客服機(jī)器人

2.1.1現(xiàn)狀

2.1.2對話增加情感分析

2.1.3對話增強(qiáng)自我學(xué)習(xí)

2.14 對話增強(qiáng)意圖分析、上下文分析

2.15其他

2.2語音助手

2.3直播間輔助

2.3.1 場景1:語言表達(dá)缺陷

2.3.2.場景2:直播環(huán)境語音不可用時(shí)

2.3.3 場景3:直播間輔助

4. 總結(jié)

1. 內(nèi)容分發(fā)在直播平臺中的AI應(yīng)用

首先,根據(jù)直播平臺的內(nèi)容,可泛分為三種:內(nèi)容創(chuàng)作者(主播)、視頻直播、小視頻;

其次,從內(nèi)容的“進(jìn)與出”,可分兩大方面:一是內(nèi)容的審核監(jiān)管,二是個(gè)性化的內(nèi)容分發(fā)。

最后,內(nèi)容的生產(chǎn)創(chuàng)作方面(這個(gè)本文先不討論,以后單獨(dú)再發(fā))

1.1 內(nèi)容的審核監(jiān)管

該場景聚焦的是:科學(xué)管控、提升效率,降低成本。

1.1.1 先說:問題和風(fēng)險(xiǎn)

(1)直播內(nèi)容監(jiān)控復(fù)雜度高,人工易漏判

違規(guī)的直播有多種類型,如涉黃、廣告、侵權(quán)、賭博、暴力、政治、敏感、屏中屏等,人工以或標(biāo)準(zhǔn)化的審核模型難以精準(zhǔn)識別,誤判、漏判的概率較高。

(2)網(wǎng)絡(luò)直播規(guī)模龐大,人工審核成本高

監(jiān)管要求24小時(shí)實(shí)時(shí)進(jìn)行,雖然違規(guī)比例占比不高,但為了做到“無漏網(wǎng)之魚”,需要投入大量的人力、物力和財(cái)力進(jìn)行監(jiān)管,運(yùn)營成本壓力增加。

(3)直播流量聚焦夜晚,人工審核效率低

夜晚疲勞,人眼識別精確度降低,出現(xiàn)誤判漏判的概率上漲,審核效率降低,難以達(dá)到網(wǎng)絡(luò)直播的內(nèi)容監(jiān)管需求。

(4)主播實(shí)名及直播實(shí)時(shí)驗(yàn)證難

一是主播注冊的實(shí)名驗(yàn)證,若完全依靠人力審核,人力成本增加,難以做到真實(shí)有效的審核;二是每次主播直播時(shí),都驗(yàn)證是否屬于本人在直播,這又增加一部分人力成本,運(yùn)營難度上升。

1.1.2 再看:傳統(tǒng)的解決

傳統(tǒng)的審核方式主要有三種:

  • 純?nèi)斯徍耍?/strong>人員“三班倒”工作,人眼鑒別該圖片或視頻是否違規(guī);
  • 建立MD5數(shù)據(jù)庫:網(wǎng)監(jiān)建立存儲違規(guī)圖片、視頻的MD5數(shù)據(jù)庫,用戶上傳后自動(dòng)分析MD5是否合法,則可避免涉黃內(nèi)容重復(fù)分享。
  • 傳統(tǒng)的智能審核:如識別色情圖像,基本是通過圖片 RGB 值識別膚色比例;通過建模識別異常動(dòng)作、敏感部位等。

弊端:這些審核方式都存在較大的漏洞?!叭嗟埂钡娜斯と菀讓?dǎo)致審核效率低、誤判漏判多等主觀性問題;MD5則非常容易被篡改;傳統(tǒng)智能識別色情圖片準(zhǔn)確率低、經(jīng)常誤報(bào)等。同時(shí),對近兩年熱門的視頻直播審核需求更難以滿足。

1.1.3 應(yīng)用改進(jìn):AI

基于上述場景與問題,可引入AI技術(shù)落地優(yōu)化。

(1)方案:利用AI識別+人工審核的模式

(2)場景:如舉例“鑒黃”:通過鑒黃模型對內(nèi)容分析的類型為“色情”、“性感”和“正常”三類,并且機(jī)器會(huì)自動(dòng)將識別結(jié)果分為確定和復(fù)審兩部分,確認(rèn)部分的識別精確度達(dá)到或超過人工,無需復(fù)審,對于復(fù)審部分,機(jī)器會(huì)根據(jù)可能性排序,人工再根據(jù)概率從高到低來審核。

同樣,可延伸至主播封面圖等審核任務(wù)。

1.2 個(gè)性化的內(nèi)容分發(fā)

聚焦:視頻直播的推薦結(jié)果與用戶的心理預(yù)期重合度變大,用戶在觀看直播時(shí)的選擇更加直觀和精準(zhǔn),用戶的活躍度明顯提高,平臺的點(diǎn)擊率和留存率明顯上漲。

1.2.1 背景

大數(shù)據(jù)時(shí)代,對于電商、內(nèi)容型產(chǎn)品,個(gè)性化推薦已成標(biāo)配,應(yīng)用好處不多復(fù)述。

此處的內(nèi)容分發(fā),側(cè)指的是前端的個(gè)性化內(nèi)容排序,即個(gè)性化推薦。

目前主流的推薦算法是協(xié)同過濾,推薦引擎是多種推薦算法組合的。此處也不對算法層面過多開展,側(cè)重關(guān)注的是:無論是何種算法引擎,都是基于用戶畫像、貨物(內(nèi)容)畫像的基礎(chǔ)上進(jìn)行計(jì)算。沒有這些基礎(chǔ)特征是難以開展個(gè)性化的內(nèi)容分發(fā)。

產(chǎn)品經(jīng)理角度淺談:YY直播平臺中內(nèi)容分發(fā)、自然語言對話NLP的人工智能AI

同時(shí),用戶畫像中的興趣、行為偏好,往往受內(nèi)容畫像所映射的。如A用戶閱讀一篇名為“周杰倫最新演唱會(huì)定時(shí)間了!”,可能會(huì)被標(biāo)上“娛樂偏好”、“周杰倫”等標(biāo)簽,并通過不同的行為給予不同的權(quán)重分值。因此,如何識別出內(nèi)容的特征,是影響著個(gè)性化內(nèi)容分發(fā)的效果、效率、體驗(yàn)。

1.2.2 利用AI挖掘出內(nèi)容特征

此處只針對視頻直播進(jìn)行分析。

利用AI技術(shù)從人臉、圖像、音樂和語言四個(gè)維度對視頻直播進(jìn)行分析和理解,可以對其做出基本的分類,特征化。

(1)從內(nèi)容看特點(diǎn)

  • 從內(nèi)容識別難度來看,視頻直播比文章、圖片的難度要大;
  • 從內(nèi)容特性來看,直播有互動(dòng)性、場景性、才藝類型等,甚至還有“主播”調(diào)性;
  • 從內(nèi)容時(shí)效來看,直播是實(shí)時(shí)的;
  • …….

(2)應(yīng)用流程

首先,按上述特點(diǎn),應(yīng)對視頻直播的內(nèi)容按多種維度劃分,利用AI對內(nèi)容識別,挖掘出豐富內(nèi)容特征。

其次,由于直播是實(shí)時(shí)性,是由主播產(chǎn)出,是先有主播再有視頻直播內(nèi)容。因此,此處的對直播內(nèi)容識別出的特征,應(yīng)是給主播打上。

最后,可以考慮一種的個(gè)性化內(nèi)容分發(fā)是:用戶特征+主播特征,進(jìn)入推薦引擎計(jì)算,召回一批符合用戶偏好的“主播權(quán)重列表”。此時(shí)再去查詢這些主播是否有開直播、直播開始多久了、親密程度等等維度進(jìn)行綜合推薦,以達(dá)到個(gè)性化內(nèi)容分發(fā)。

(3)AI識別維度、內(nèi)容分發(fā)排序

列舉一些對內(nèi)容識別的特征維度(舉例一些,不全):

從直播來看:

  • 互動(dòng)性:主播與粉絲的互動(dòng)情況,包括語言交流反饋、問答情況等。
  • 打賞性:打賞刷禮物,直接反應(yīng)收入狀況。有時(shí)需考慮業(yè)務(wù)的干擾,利于平臺傭金收入。
  • 時(shí)長度:直播的時(shí)間長度;
  • 場景:直播的場景,是戶外還是戶內(nèi)。如直播間、運(yùn)動(dòng)場、健身房、車內(nèi)等;
  • 物體:貨物、擺件,美妝物品等;
  • 離場:是否有離場,頻次等。

從主播來看:

  • 行為:唱歌,聊天,表演,魔術(shù),解說,多手勢…
  • 聲音:甜美系,女漢子系,治愈系…;
  • 才藝:彈琴,唱歌…;
  • 風(fēng)格:韓系裝扮,性感,成熟,紳士,運(yùn)動(dòng)陽光,萌妹子…
  • 性別:男,女…
  • 年齡:年齡區(qū)間,或XX后,視模型口徑;
  • 顏值:….

舉例:

  • 風(fēng)格:一個(gè)喜歡做嘟嘴表情的年輕女主播,會(huì)有很大可能被打上“萌妹子”的標(biāo)簽(人臉識別);
  • 顏值:基于顏值模型判斷主播的顏值分(人臉識別)
  • 聲音:基于模型判斷出主播的聲音(語音識別)
  • 手勢:一個(gè)主播常喜歡做比心、愛心、嘟嘴等一連貫的手勢肢體動(dòng)作,可能被打上手勢大人、愛互動(dòng)等標(biāo)簽(動(dòng)態(tài)手勢識別)

上面這些的識別基本都需要結(jié)合AI技術(shù)進(jìn)行,挖掘出內(nèi)容特征作為推薦使用。

(4)個(gè)性化內(nèi)容分發(fā)的排序-算法

自己YY一下基本的維度:

產(chǎn)品經(jīng)理角度淺談:YY直播平臺中內(nèi)容分發(fā)、自然語言對話NLP的人工智能AI

(5)其他

個(gè)性化的內(nèi)容分發(fā),可以用于多個(gè)場景,如搜索結(jié)果頁、首頁、關(guān)注頁等,基于不同用戶分群進(jìn)行個(gè)性化推薦策略。此外,除了在內(nèi)容特征識別應(yīng)用AI,在推薦引擎中的深度學(xué)習(xí)、知識圖譜也是AI在支撐。

2. 自然語言對話在直播平臺中的AI應(yīng)用

首先,NLP涉及領(lǐng)域很多,凡是有自然語言(語音、文字)輸入的場景,都有可能會(huì)使用到。如語義分析、機(jī)器翻譯等。此處的自然語言對話,側(cè)指智能助理/智能問答/語音服務(wù)等方面。個(gè)人理解是:即利用AI技術(shù)打造出:統(tǒng)一的CUI(對話交互界面)、一站式的整合信息&服務(wù)。

其次,若按對話的場景區(qū)分有:封閉域?qū)υ?、開放域?qū)υ挕Mㄋ椎恼f,前者是”要求用戶輸入指定地話語才能繼續(xù)對話”,輸入輸出是可枚舉的、有明確始與終;后者是“用戶愛說什么就說什么都可以持續(xù)對話”,輸入輸出無法窮盡、無明確流程。

若按對話內(nèi)容方式有:文字、語音。(一般情況下,文字可以直接處理,如果是語音,通常情況下需要將語音轉(zhuǎn)換成文字(ASR技術(shù))

一般原理是:是用戶輸入,引擎內(nèi)部通過長期積累的知識,首先經(jīng)過自然語言分析,在通過語義理解、上下文分析進(jìn)行知識推理,從而生成個(gè)性化的答案,輸出給用戶。整個(gè)典型的自然語言對話如下圖。

產(chǎn)品經(jīng)理角度淺談:YY直播平臺中內(nèi)容分發(fā)、自然語言對話NLP的人工智能AI

最后,從幾個(gè)場景去分析,包括有:客服機(jī)器人、語音助手、直播間輔助。

2.1 客服機(jī)器人

基本原理是:輸入的是用戶的問題,引擎內(nèi)部通過長期積累的知識,首先經(jīng)過自然語言分析,在通過語義理解、上下文分析進(jìn)行知識推理,從而生成個(gè)性化的答案,輸出給用戶。整個(gè)典型的自然語言對話如下圖。

2.1.1 現(xiàn)狀

客服機(jī)器人依據(jù)媒體類型分為兩種,基于電話語音,基于文本信息。前者如10086的自助語音服務(wù);后者一般是置于應(yīng)用中,能解決簡單而又大量重復(fù)問題,以節(jié)約成本,如淘寶的小蜜、萬象,直播APP里的客服助手等。

從輸入方式來看有:語音輸入和文字輸入,技術(shù)上的區(qū)別是語音輸入要做語音識別,將語音信號轉(zhuǎn)換成文字。目前客服機(jī)器人主要是兩者都支持。

從輸出方式來看有:文字輸出、圖像輸出、語音輸出。這個(gè)類型視業(yè)務(wù)需求、產(chǎn)品場景所決定。目前客服機(jī)器人主要是文字輸出,一般基于用戶畫像預(yù)測問題、熱門問題前置等。

如下圖的所示,屬于能支持自然語言對話(語音+文本)的客服機(jī)器人。

產(chǎn)品經(jīng)理角度淺談:YY直播平臺中內(nèi)容分發(fā)、自然語言對話NLP的人工智能AI

問答機(jī)器人其實(shí)是在頭部問題上實(shí)現(xiàn)了綜合過濾,然后通過對話的形式反饋給用戶,如果用戶實(shí)在問的是長尾問題,問答機(jī)器人回答不了的,此時(shí)可走人工客服。滿足了用戶九成以上問題的直接答復(fù),是問答機(jī)器人的核心目標(biāo)。滿足在服務(wù)上,縮短服務(wù)尋求路徑與服務(wù)尋得率,從而提升用戶自助體驗(yàn),降低人工入線率,降低運(yùn)營成本。

2.1.2 對話增加情感分析

即相當(dāng)于賦予客服機(jī)器人EQ,能在對話中對語義進(jìn)行分析,精準(zhǔn)感知用戶情緒,并在回復(fù)表達(dá)中蘊(yùn)含相應(yīng)情感,讓互動(dòng)更有溫度。

原理是自動(dòng)識別對話過程的文字或語音,尤其是帶有主觀描述的進(jìn)行情感分析,如,可以識別生氣、喜悅、失望、著急等多種人類細(xì)分情感,對此生成相應(yīng)帶情感的、口語化的表達(dá),若判斷精準(zhǔn),能讓用戶體驗(yàn)佳,不冰冷。

舉個(gè)例子如下圖,JD客服JIMI機(jī)器人增加情感分析,從IQ到EQ的升級,用戶體驗(yàn)上是有明顯差異的:

產(chǎn)品經(jīng)理角度淺談:YY直播平臺中內(nèi)容分發(fā)、自然語言對話NLP的人工智能AI

此外,增加情感分析也可用作對話質(zhì)量(服務(wù))評估。如根據(jù)前來咨詢的客戶來時(shí)的情緒,以及離開時(shí)情緒的對比,就能從另一個(gè)維度感知此次服務(wù)的質(zhì)量。既可以用以考核客服人員,也可以用來改進(jìn)客服的服務(wù)。

2.1.3 對話增強(qiáng)自我學(xué)習(xí)

場景:客服機(jī)器人無法滿足用戶需求,出現(xiàn)呼叫人工客服。

在人工溝通-解決的過程,客服機(jī)器人應(yīng)將此對話過程沉淀學(xué)習(xí)。如記錄下:呼叫人工客服前的對話過程、人工對話的過程,分析不足與改進(jìn)點(diǎn)。若每一次人工解決問題,中間的所有信息都被人工智能所記錄,多次學(xué)習(xí)自我進(jìn)化,能提升客服機(jī)器人對話服務(wù)質(zhì)量。

2.14 對話增強(qiáng)意圖分析、上下文分析

場景:客服機(jī)器人增加意圖推薦模塊,當(dāng)開始對話過程時(shí),能基于用戶過往的行為偏好分析,主動(dòng)預(yù)測用戶意圖,提供相應(yīng)信息。(非常見熱門問題)

場景:對話過程中的上下文,分析預(yù)測相應(yīng)的場景、語境,進(jìn)而精準(zhǔn)服務(wù)。

2.15 其他

不能以對話輪數(shù)多少相比。

比如,人類用戶與小冰的平均每次對話輪數(shù)可達(dá)到23輪,微軟對此也頗為津津樂道,但是,在客服上,如果機(jī)器人要與前來咨詢的客戶對話23輪,才能給出答案,你可以想象客戶的反應(yīng)會(huì)是什么。

2.2 語音助手

相比較于客服機(jī)器人,語音助手更是起到連接、推薦作用。用戶通過輸入語音或文字,可調(diào)用直播平臺內(nèi)各項(xiàng)功能、服務(wù)。整個(gè)對話過程是類似開放域的場景。

  • 場景1:如用戶輸入“我關(guān)注的主播有哪些已經(jīng)開播?”,得到對話可以是告訴有哪些主播在開播,開播多久了,直播間的互動(dòng)情況,甚至根據(jù)用戶偏好及其他維度分析,優(yōu)先推薦哪個(gè)直播間;
  • 場景2:如新用戶剛來,又沒有強(qiáng)目的、強(qiáng)關(guān)注的主播等。或許可以通過助手進(jìn)行對話引導(dǎo),獲取偏好進(jìn)行直播推薦,甚至是某個(gè)主播,并將該主播的一些信息進(jìn)行描述,讓用戶多方面了解;
  • 場景3:如猜你喜歡什么主播或直播,那么助手對話過程的引導(dǎo)可以有多種,或許通過用戶自拍、發(fā)送某些圖像信息等,給出相應(yīng)趣味的關(guān)聯(lián)分析,如性別,年齡等,以此提供個(gè)性化推薦服務(wù);
  • 場景4:……

2.3 直播間輔助

自古民間出高人。對于直播的平臺是歡迎各大IP入住開播,主播也樂于展顯看家本領(lǐng)。而直播更具強(qiáng)調(diào)互動(dòng)性,直播過程中需要通過言語肢體等與粉絲互動(dòng),其中,言語表達(dá)尤為基礎(chǔ)重要。

2.3.1 場景一:語言表達(dá)缺陷

有一類人,他們身患絕技、各懷才藝,卻有表達(dá)缺陷,如啞巴。在如今強(qiáng)調(diào)人人是IP、自媒體的時(shí)代,他們可能因此而失去一些做主播的機(jī)會(huì)。

但是,他們本身是懂表達(dá),如唇語、手語。從本質(zhì)上,一切人類溝通的語言都屬于自然語言。因此,能利用AI的技術(shù)手段進(jìn)行識別、跟蹤,通過NLU進(jìn)行理解、翻譯,最后輸入語音表達(dá)。

關(guān)于輔助聲音,創(chuàng)作者錄音通過聲音模型學(xué)習(xí),盡量擬合原聲或差異個(gè)性化的。

同時(shí),若聲音實(shí)現(xiàn)不理想,也可以將唇語或手語識別進(jìn)行文本翻譯,也是一種互動(dòng)方式。

2.3.2 場景二:直播環(huán)境語音不可用時(shí)

直播過程中或許存在一些語音不可用的場景,如噪音突然變大、攝像頭未配備麥克風(fēng)(損壞)。這時(shí),若主播調(diào)用唇語識別功能,基于以上原理能保持直播間互動(dòng)正常,避免突然冷場中斷、離場等情況。

2.3.3 場景三:直播間輔助

場景:針對現(xiàn)場直播解說類,為主播解說提供輔助。如,體育、游戲等競技類的比賽直播。

這里的輔助有4個(gè)方面:

  • 針對直播視頻的信息:能實(shí)時(shí)提取一些相關(guān)的信息。如動(dòng)作、球員信息,能夠識別并輸出文字記錄,類似對話模式,或許可以供主播對大盤比賽有參考;
  • 針對直播間的互動(dòng)解說:有時(shí)候主播對于粉絲、或者解說某些內(nèi)容有些疑惑,如想中途插入一些故事或者其他相關(guān)情節(jié)、解答粉絲的熱門問題。此時(shí)直播間的助手可以將這些對話記錄并分析,根據(jù)熱門信息或關(guān)鍵詞進(jìn)行尋找,以供主播進(jìn)行參考以更好解說,或許也能滿足粉絲的互動(dòng)提問,活躍氛圍。
  • 針對直播視頻,增加虛擬主播解說。如某場球賽直播,在視頻中進(jìn)行識別,如球員頭像、動(dòng)作行為、跑動(dòng)軌跡等特征,再用語音的方式來為用戶解讀比賽進(jìn)程,提供精選球迷評論、分享球星趣事等; 或許用戶還可根據(jù)興趣選擇喜歡的球星觀看,讓虛擬主播成為自己專屬的機(jī)器人解說員。
  • …..

4. 總結(jié)

最近對AI進(jìn)行學(xué)習(xí)了解,包括從概念知識、應(yīng)用領(lǐng)域、AI產(chǎn)品經(jīng)理的相關(guān)工作流程等方面。同時(shí)參閱其他資料信息,對于AI PM有一些看法總結(jié),其中這些也是和傳統(tǒng)PM差異點(diǎn):

4.1 需要了解技術(shù)現(xiàn)狀

這里的現(xiàn)狀,側(cè)重是指技術(shù)原理、邊界。每一項(xiàng)技術(shù)都有邊界和最優(yōu)應(yīng)用場景,尤其目前AI技術(shù)相對是不夠成熟的,那么了解好技術(shù)可能實(shí)現(xiàn)的能力范圍、所需的成本、當(dāng)前存在的技術(shù)瓶頸…,具備這些基礎(chǔ)會(huì)更好去溝通、發(fā)散和結(jié)合。

4.2 需要尋找并定義AI業(yè)務(wù)場景

正如上述所言,理解技術(shù)優(yōu)劣勢的基礎(chǔ)上,尋找到可以提供更好用戶體驗(yàn)的業(yè)務(wù)場景。也就是說,如何結(jié)合當(dāng)前現(xiàn)有AI技術(shù)與業(yè)務(wù)場景,為用戶提供更好更便捷用戶體驗(yàn)的產(chǎn)品。因此其中主要的工作就是:完成當(dāng)前技術(shù)與現(xiàn)有市場需求的映射,側(cè)重對場景的思考。

4.3 多一層評估、多一層挖掘價(jià)值

當(dāng)前AI技術(shù)的實(shí)現(xiàn)成本相對還是高。也并非有想法就能實(shí)現(xiàn),即使條件+成本都能滿足時(shí),也存在較大試錯(cuò)風(fēng)險(xiǎn)。因此還需對場景多思考,充分評估產(chǎn)品定位、用戶價(jià)值、成本、商業(yè)價(jià)值等因素是否相匹配。讓現(xiàn)有技術(shù)所定義的產(chǎn)品價(jià)值能夠轉(zhuǎn)化為商業(yè)價(jià)值。

4.4 與互聯(lián)網(wǎng)產(chǎn)品經(jīng)理的差異

(1)關(guān)注業(yè)務(wù)的范圍不同

互聯(lián)網(wǎng)PM可能會(huì)深入關(guān)注局部業(yè)務(wù)范圍的產(chǎn)品優(yōu)化與用戶價(jià)值,而AI產(chǎn)品經(jīng)理可能需要在基于公司業(yè)務(wù)的整體范圍,尋找存在AI優(yōu)化的場景需求。

(2)多了一種語音交互方式

機(jī)器學(xué)習(xí)促進(jìn)了語音識別技術(shù)的發(fā)展,也促進(jìn)發(fā)展了語音交互場景。AI語音交互的設(shè)計(jì)可能比手機(jī)/PC端的交互設(shè)計(jì)難很多,因?yàn)檎Z音交互系統(tǒng)不是限定好的GUI操作界面,而是不便于規(guī)范且自由延展的自然語言。會(huì)話的開放性意味著 AI 交互設(shè)計(jì)者必須考慮用戶可能采取的幾乎無數(shù)的選擇。要能夠理解用戶,了解他們的動(dòng)機(jī),然后合乎邏輯地思考如何引導(dǎo)他們完成一件事情。

(3)更多的理論基礎(chǔ)支撐

機(jī)器學(xué)習(xí)的理解、算法模型優(yōu)化等等。

(碼字不易分享可貴!歡迎關(guān)注收藏后續(xù)再更新….)

 

本文由 @鳳城狂客 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Pexels,基于 CC0 協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 干貨啊,老哥

    來自上海 回復(fù)