進(jìn)擊的人工智能:從產(chǎn)品角度,深度解析「對(duì)話機(jī)器人」

7 評(píng)論 28983 瀏覽 174 收藏 49 分鐘

任何一款產(chǎn)品的出現(xiàn),都是源自用戶需求。要么是已經(jīng)存在的存量需求,要么是正在規(guī)?;脑隽啃枨?,對(duì)話機(jī)器人也不例外。當(dāng)我們?cè)谡務(wù)摗皩?duì)話機(jī)器人”產(chǎn)品時(shí),我們?cè)撊绾慰创澈蟮男枨竽兀?/p>

今天,擁有對(duì)話能力的機(jī)器人,被逐漸認(rèn)為是一種核心智能,是否能夠流利地完成對(duì)話,可被視作這款機(jī)器人是否真正擁有智能的唯一憑證。

從可以追溯的歷史資料來(lái)看,對(duì)話機(jī)器人(chat-bot)至少在上世紀(jì)六十年代就已經(jīng)問(wèn)世,經(jīng)過(guò)近五六十年的發(fā)展,今天我們已經(jīng)可以在許多產(chǎn)品中看到對(duì)話機(jī)器人的影子,微軟的Cortana、小冰,蘋果的Siri、Google Now、阿里小蜜、百度度秘、圖靈機(jī)器人、助理來(lái)也、出門問(wèn)問(wèn)等等。

可以肯定的是:對(duì)話機(jī)器人已經(jīng)成為了一種業(yè)界時(shí)尚,越來(lái)越多的公司試圖通過(guò)這種全新的交互形式,來(lái)優(yōu)化或者升級(jí)自己產(chǎn)品——我們已經(jīng)可以在許多的產(chǎn)品中看到各種名為“小X機(jī)器人”的子產(chǎn)品。

如此多的對(duì)話機(jī)器人很容易給人一種百花齊放、方興未艾的感覺(jué)。我們可能會(huì)隱約覺(jué)得:每家的對(duì)話機(jī)器人產(chǎn)品都大同小異,有些家的產(chǎn)品會(huì)有一些別樣的特征,可是終究給人一種不屬于過(guò)去十年移動(dòng)互聯(lián)網(wǎng)發(fā)展的感覺(jué)——這些對(duì)話機(jī)器人似乎都還處在很早期,用戶量似乎都不大,顯得都有些小眾。?

我將試圖站在純產(chǎn)品的視角分析:一款產(chǎn)品對(duì)話機(jī)器人背后,需求和產(chǎn)品邏輯是怎樣的(文中我無(wú)意去對(duì)比各家對(duì)話機(jī)器人的優(yōu)劣,也不討論某款對(duì)話機(jī)器人的產(chǎn)品觀或方法論)。

一、探索“對(duì)話”行為背后的需求

首先,我們?cè)噲D探索“對(duì)話”這一行為的場(chǎng)景與背后的需求。

在《人類簡(jiǎn)史》一書中,認(rèn)為語(yǔ)言能力是智人區(qū)別于其他猿類最重要的特質(zhì)和能力;因?yàn)檎Z(yǔ)言能力,智人可以互相通過(guò)對(duì)話而形成更豐富的交互,從而才有了協(xié)作和后來(lái)的文明。

人類有三種最直接的方式來(lái)使用語(yǔ)言:“一對(duì)零”、“一對(duì)多”、“一對(duì)一”。

  • “一對(duì)零”是自我內(nèi)化的反思、總結(jié)、沉淀,不向外做交互和分享。
  • “一對(duì)多”是廣播式的宣講和相對(duì)單向的輸出,譬如開(kāi)大會(huì)或者發(fā)號(hào)施令。
  • “一對(duì)一”是對(duì)話——群聊也是由許多的“一對(duì)一”構(gòu)成的,所以我認(rèn)為不存在真正意義上的“多對(duì)多”對(duì)話。我認(rèn)為對(duì)話是我們?nèi)伺c外界進(jìn)行交互的最直接即時(shí)的途徑(注意“即時(shí)”很重要)

所謂對(duì)話,一定是一個(gè)雙方交互行為,并且互為I/O(input / output)的過(guò)程。比如兩個(gè)人對(duì)話,每個(gè)人所說(shuō)的話,對(duì)于自己而言是輸出,對(duì)于對(duì)方而言是輸入。原則上,對(duì)話可以永遠(yuǎn)持續(xù)下去。

但我們幾乎從未見(jiàn)過(guò)兩個(gè)人會(huì)永遠(yuǎn)在對(duì)話,那是因?yàn)椋喝绻枰獙?duì)話持續(xù)下去,雙方都需要保持參與;任何一方覺(jué)得疲勞或者無(wú)價(jià)值感了,對(duì)話就會(huì)終止。

對(duì)話的場(chǎng)景更加貼近我們的生活行為,它頻次最高,且環(huán)境開(kāi)放多變,分析它背后的需求并不容易?,F(xiàn)在,我們需要回答兩個(gè)問(wèn)題:

1.1 第一個(gè)問(wèn)題:對(duì)話為什么能夠開(kāi)始?

我認(rèn)為人在對(duì)話中存在三個(gè)層面的需求。

第一層,是基礎(chǔ)問(wèn)答的需求??梢悦枋鰹椋?/p>

我有一個(gè)問(wèn)題,請(qǐng)你回答我。

二次追問(wèn)的問(wèn)題,屬于新問(wèn)題。這個(gè)過(guò)程,非常類似于我們今天所使用的搜索引擎。

第二層,是任務(wù)流程協(xié)作的需求,以達(dá)成某種目的為止。可以描述為:我想請(qǐng)你幫我買一張明天下午14:00-18:00出發(fā),北京到上海的機(jī)票;經(jīng)濟(jì)艙,盡可能便宜,最好是東航的。我們和朋友相約去逛街,拜托同事幫忙預(yù)定會(huì)議室,接受閨蜜的請(qǐng)求明早叫她起床。

這些都是任務(wù)流程協(xié)作的需求。

第三層,是共同的情感建立,無(wú)論喜怒哀樂(lè)。聊天的目標(biāo)很難定量量化,我們更多是嘗試定性地去制定聊天的目標(biāo)??赡苁切那椴缓眯枰伺?,也可能是好事情需要向好朋友分享,我們需要對(duì)話來(lái)表達(dá)進(jìn)行最直接即時(shí)的表達(dá)。

我并不認(rèn)為只有孤獨(dú)的情感才需要對(duì)話——人作為擁有萬(wàn)年發(fā)展歷程的群居動(dòng)物,與他人進(jìn)行情感分享是早已刻入基因的特質(zhì)。只是我們建立的情感在不同人之間會(huì)有所不同,對(duì)于信任之人的情感建立會(huì)很深刻,而對(duì)于點(diǎn)頭之交則會(huì)保留許多。

開(kāi)啟一段對(duì)話一定源自上述的某種需求,而開(kāi)啟的契機(jī)則是一個(gè)相對(duì)明確的話題,哪怕只是一句“我餓了”。

1.2 第二個(gè)問(wèn)題:對(duì)話為什么會(huì)持續(xù)?

對(duì)話能夠持續(xù),是有兩個(gè)層面的原因。

第一個(gè)原因,是至少一方的需求沒(méi)有得到滿足。比如我去提問(wèn)題,對(duì)方回答我不滿意,我就會(huì)持續(xù)追問(wèn)。兩個(gè)女生在一起聊八卦,聽(tīng)的人很入神,講的人才有成就感能繼續(xù)講下去。

第二個(gè)原因,是雙方相對(duì)平等。如果我提了個(gè)問(wèn)題,或者請(qǐng)對(duì)方幫個(gè)忙,但是對(duì)方始終是一種高姿態(tài)不搭理我,那我就很容易放棄,不想聊了。反過(guò)來(lái),如果對(duì)方對(duì)我過(guò)分尊敬,總在說(shuō)一些沒(méi)有營(yíng)養(yǎng)的恭維拍馬屁的話,時(shí)間久了,我也會(huì)變得更虛榮,而且會(huì)覺(jué)得很無(wú)聊。所以,人不會(huì)和自己階層或者品味相差太多的人聊天,絕大多數(shù)人更不會(huì)和寵物長(zhǎng)時(shí)間聊天。

對(duì)話會(huì)終止,最根本的原因是:雙方都放棄了這輪對(duì)話。

感性一些來(lái)描述對(duì)話終止的原因,可以認(rèn)為是雙方都覺(jué)得“疲憊”了,也就是這一輪對(duì)話的能耗消耗殆盡;哪怕是情侶之間說(shuō)甜言蜜語(yǔ),聊個(gè)兩三千句也會(huì)覺(jué)得累了,也會(huì)在十幾個(gè)回合的互道“晚安”中結(jié)束本次對(duì)話。

所以,對(duì)話總會(huì)終止,能耗殆盡就會(huì)終止。

二、“對(duì)話機(jī)器人”產(chǎn)品的發(fā)展源自搜索引擎

在我以前的文章《進(jìn)階之路:站在高視角看產(chǎn)品是一種怎樣的體驗(yàn)》中,講述過(guò)一個(gè)概念,叫做“知識(shí)詛咒”。簡(jiǎn)單說(shuō):現(xiàn)在我明白一件事情,但是要完整清楚的講授給你,是很難的;因?yàn)槲覀兯鶕碛械闹R(shí)背景不同,我們對(duì)同一件事情的理解不同。這也就解釋了為什么很多老師在上課的時(shí)候索然無(wú)味,很多人做Presentation的時(shí)候顯得蒼白無(wú)力,這其實(shí)是知識(shí)詛咒在起作用。

知識(shí)詛咒帶來(lái)一個(gè)很大的問(wèn)題,就是每當(dāng)我們接觸到一個(gè)陌生事物時(shí),都會(huì)和自己的背景知識(shí)進(jìn)行類比。譬如對(duì)于長(zhǎng)發(fā)飄飄的素顏美女,在我所知中,這類美女一般都是家境不錯(cuò),待人溫柔,家教優(yōu)良。所以當(dāng)我再次見(jiàn)到一個(gè)類似的美女時(shí),我會(huì)做相似的第一印象類比。

不只是美女,我們幾乎所有的認(rèn)知都源自于過(guò)往的背景知識(shí)。

在人類發(fā)展的歷史上,對(duì)于即時(shí)的問(wèn)答需求幾乎時(shí)時(shí)刻刻都存在。最早大家是詢問(wèn)部落中最年長(zhǎng)的智者,后來(lái)大家互相都有了知識(shí)儲(chǔ)備,就可以通過(guò)對(duì)話來(lái)進(jìn)行基本的問(wèn)答和辯論——這一個(gè)過(guò)程持續(xù)了千萬(wàn)年。同一個(gè)問(wèn)題,最早時(shí)只能去問(wèn)一個(gè)人,得到一個(gè)答案;到后來(lái),可以去問(wèn)很多人,得到許多答案,然后“擇其善者而從之”。如果我能把所有人都問(wèn)一遍,可能會(huì)得到一個(gè)巨大的答案集合;我需要過(guò)濾、排序、取舍,你發(fā)現(xiàn),這個(gè)過(guò)程就是“搜索引擎”。我們使用搜索引擎時(shí),是通過(guò)一個(gè)“輸入框”輸入想問(wèn)的問(wèn)題或者關(guān)鍵詞,然后搜索引擎會(huì)丟給我一個(gè)經(jīng)過(guò)相關(guān)性排序和優(yōu)化的答案集合。

但我認(rèn)為兩個(gè)原因,會(huì)導(dǎo)致搜索引擎會(huì)逐漸向?qū)υ挋C(jī)器人演變。

2.1 其一:精準(zhǔn)答案的需求愈發(fā)旺盛

搜索引擎從簡(jiǎn)單的信息集合展示,逐漸向精準(zhǔn)答案給予,這個(gè)已經(jīng)持續(xù)了好幾年。“百度阿拉丁”就是這方面的典型,譬如當(dāng)你問(wèn)“北京天氣”,百度搜索結(jié)果頁(yè)第一項(xiàng)是經(jīng)過(guò)精心設(shè)計(jì)的天氣卡,會(huì)通過(guò)豐富的UI展示天氣相關(guān)的信息。在頭部熱門搜索詞中,阿拉丁已經(jīng)可以覆蓋大多數(shù),但是對(duì)于腰部需求和長(zhǎng)尾需求,隨著信息爆炸,人們對(duì)于翻多頁(yè)進(jìn)行搜索的忍耐度會(huì)越來(lái)越低,對(duì)于“快”“準(zhǔn)”的需求只會(huì)越來(lái)越大。

2.2 其二:搜索場(chǎng)景下輸入能耗太大

從能耗體驗(yàn)的角度來(lái)說(shuō),搜索的輸入框遠(yuǎn)高于對(duì)話聊天的輸入框,即使是同一個(gè)話題的持續(xù)輸入,對(duì)話聊天的疲勞感也會(huì)明顯低于搜索。

如果今天人們每天平均提問(wèn)的次數(shù)是N,那么幾年后會(huì)迅速到10N,體驗(yàn)不升級(jí)會(huì)很難讓用戶滿意。而回歸對(duì)話的方式,是一種很好的體驗(yàn)優(yōu)化,可以抵消需求的增長(zhǎng)。

三、“對(duì)話機(jī)器人”產(chǎn)品場(chǎng)景:封閉域?qū)υ?VS 開(kāi)放域?qū)υ?/h2>

優(yōu)秀的產(chǎn)品經(jīng)理很懂得如何控制自己的用戶使用產(chǎn)品時(shí)的各種操作,從而提前把控用戶的預(yù)期,進(jìn)而達(dá)到體驗(yàn)的相對(duì)最優(yōu)。

許多優(yōu)秀App的基本設(shè)計(jì)邏輯就是:頁(yè)面之間的跳轉(zhuǎn)有規(guī)則且有順序,這樣用戶不會(huì)通過(guò)點(diǎn)擊跳出預(yù)設(shè)流程,預(yù)期就相對(duì)可控。手機(jī)上的App產(chǎn)品交互中,可以通過(guò)各種邏輯和提示信息來(lái)把控預(yù)期——可是對(duì)話機(jī)器人該如何控制預(yù)期呢?

由于對(duì)話機(jī)器人用戶幾乎都是通過(guò)自然語(yǔ)言輸入實(shí)現(xiàn)交互,而且每次只有一句;所以只能通過(guò)用戶的輸入,以及針對(duì)輸入的回復(fù)來(lái)實(shí)現(xiàn)用戶預(yù)期的把控。

可是在對(duì)話聊天的場(chǎng)景中,用戶的輸入時(shí)而可控,時(shí)而不可控;我們做不到像App設(shè)計(jì)那樣可以制造一個(gè)封閉的邏輯閉環(huán)來(lái)讓用戶遵守規(guī)則——對(duì)話聊天是一個(gè)天然的開(kāi)放場(chǎng)景,用戶平時(shí)怎么和朋友對(duì)話,和機(jī)器人也會(huì)怎么對(duì)話。

因此,我們?nèi)藶榈匕褜?duì)話分為兩種場(chǎng)景:

  • 封閉域?qū)υ挘?/strong>要求用戶輸入指定地話語(yǔ)才能繼續(xù)對(duì)話
  • 開(kāi)放域?qū)υ挘?/strong>用戶愛(ài)說(shuō)什么就說(shuō)什么都可以持續(xù)對(duì)話

3.1 封閉域?qū)υ?/strong>

封閉域?qū)υ捰袃蓚€(gè)關(guān)鍵的特征:

  1. 輸入和輸出可歸類可枚舉
  2. 對(duì)話有明確的始和終,且有流程

所以,在對(duì)話的三個(gè)需求中,問(wèn)答和任務(wù)流程協(xié)作都屬于封閉域?qū)υ挕?/p>

封閉域?qū)υ挼脑O(shè)計(jì)邏輯延續(xù)自“IFTTT(if this then that)”,是workflow的進(jìn)化交互形式(感興趣的同學(xué)可以去App Store去搜索一款A(yù)pp,叫做“Workflow”,它就是可以將一系列原本不相關(guān)的App通過(guò)條件判斷串聯(lián)起來(lái))。

下面我來(lái)分享兩個(gè)封閉域聊天的典型案例。

讀心機(jī)器人

10年前微軟必應(yīng)推出過(guò)一個(gè)“讀心機(jī)器人”,它會(huì)在20個(gè)問(wèn)答中猜你心中所想。這個(gè)機(jī)器人曾經(jīng)在幾年前出過(guò)一個(gè)對(duì)話問(wèn)答版本,用戶只要在每一步時(shí)回答“是”或者“不是”,對(duì)話就會(huì)持續(xù)進(jìn)行,直到猜出或者猜不出結(jié)果。

必應(yīng)讀心機(jī)器人

這就是一個(gè)典型的封閉域多倫問(wèn)答對(duì)話,用戶的輸入只有兩個(gè),而過(guò)程是一大堆背后的邏輯判斷,且有相對(duì)固定的流程,而且有明確的開(kāi)始和結(jié)束。

Amazon Echo音箱

Amazon的Echo音箱,大家都很熟悉了,Echo之所以成為爆款產(chǎn)品,很關(guān)鍵的一個(gè)原因是,它的對(duì)話機(jī)器人Alexa在Echo音箱的場(chǎng)景設(shè)計(jì)中是一個(gè)封閉域?qū)υ?。由于音箱是我們居家?chǎng)景中,除了遙控器之外最常見(jiàn)的高頻交互式Commander,我們很難再在家里找到一個(gè)這樣的硬件,它除了可以輕易地輸入指令,還可以快速且明顯地反饋。

當(dāng)我們面向Commander進(jìn)行輸入時(shí),我們可以輸入的話語(yǔ)就已經(jīng)變得局限,可以想象到的是,在居家場(chǎng)景中我們可以發(fā)出的指令幾乎就是“打開(kāi)”、“關(guān)閉”之類的。更重要的是,在居家場(chǎng)景中可以控制的物品也是有限的,而且任何一個(gè)操作的流程都很短。

所以,人們和第一代Echo音箱的對(duì)話中,輸入和輸出都是可枚舉的,而且有始有終有流程,Echo最優(yōu)秀的特質(zhì),就是它選擇了一個(gè)封閉域場(chǎng)景,極大地控制了用戶的預(yù)期,獲得了更優(yōu)的體驗(yàn)。

Amazon Echo音箱

從上面兩個(gè)例子中,我可以看到,封閉域?qū)υ捲诋a(chǎn)品設(shè)計(jì)中有幾個(gè)明顯的特征。

3.1.1 其一:封閉域?qū)υ捚鋵?shí)是workflow的延伸

其實(shí)封閉域中的“封閉”二字,無(wú)論在話題量、輸入輸出量,還是對(duì)話輪次、對(duì)話流程,都是封閉的,封閉就代表了有限集合。workflow之所以可以通過(guò)ifttt設(shè)計(jì),就是因?yàn)橛邢藜?,只有各種條件有限,才可以設(shè)計(jì)出條例清晰且邏輯合理的workflow。

封閉對(duì)話通常是為了解決某個(gè)特定的問(wèn)題或者需求,從結(jié)果來(lái)看,它的效果會(huì)顯得更加“有用”。但是,從過(guò)程來(lái)看,封閉域?qū)υ挷⒉皇且环N真正意義上的創(chuàng)新,它的效率相比workflow并沒(méi)有本質(zhì)上地提升,只是在交互的體驗(yàn)上更加接近人的語(yǔ)言交互本能,所以大多數(shù)封閉域?qū)υ挾紩?huì)設(shè)計(jì)地如同助理或者秘書,譬如阿里小蜜,百度度秘。

3.1.2 其二:封閉域?qū)υ拡?chǎng)景單一可控

封閉域由于擁有特定的目的性,往往都是在單一確定的場(chǎng)景里。如下圖中的百度度秘,兩個(gè)紅色框中的部分,是預(yù)設(shè)了各種封閉域的場(chǎng)景,每一種看似簡(jiǎn)單的功能其實(shí)都是一個(gè)特定的封閉域?qū)υ?;譬如截圖中正在使用的圖片笑話。

度秘機(jī)器人

很顯然,不同的封閉域?qū)υ捴?,?duì)話的輪次要求是不一樣的,講笑話是一個(gè)單輪次對(duì)話,度秘產(chǎn)品中通過(guò)圖中藍(lán)色框里的“再來(lái)一個(gè)”這種預(yù)設(shè)輸入,來(lái)不斷強(qiáng)化用戶輸入的單一性。而“叫外賣”這類的封閉域?qū)υ?,就?huì)是一個(gè)標(biāo)準(zhǔn)的workflow,感興趣的同學(xué)可以自己去試試。

3.1.3 其三:封閉域的邊界處理很重要

封閉域有一個(gè)很重要的問(wèn)題,就是用戶可能隨時(shí)跳出封閉域,開(kāi)始聊其他的話題,或者不按照預(yù)設(shè)的規(guī)則邏輯出牌。

譬如微軟小冰的一個(gè)封閉域?qū)υ挘凶觥靶”R(shí)狗”。

正常的邏輯中,用戶的發(fā)給小冰的應(yīng)該是一張狗的照片,可是有的用戶可能就是發(fā)了一張不是狗的照片,如下所示,那么這個(gè)時(shí)候就是邊界case,需要額外處理。用戶發(fā)來(lái)的可能是語(yǔ)音、文字、其他任何照片,每一種的處理都是需要單獨(dú)設(shè)計(jì)的。

微軟小冰之“小冰識(shí)狗”

多說(shuō)一點(diǎn),在封閉域?qū)υ挼倪吔缭O(shè)計(jì)中,很難做到萬(wàn)無(wú)一失周密完全,因?yàn)橛脩糨斎肟赡軙?huì)千奇百怪,所以最佳也是最討巧的方式,就是用開(kāi)放域?qū)υ拋?lái)“兜底”。

3.2 開(kāi)放域?qū)υ?/strong>

開(kāi)放域是相對(duì)于封閉域而言的。由于對(duì)話機(jī)器人的話題幾乎都源自用戶,而每個(gè)用戶可能有任何輸入,話題就會(huì)無(wú)法窮舉,且在多個(gè)場(chǎng)景中跳來(lái)跳去,進(jìn)而形成了所謂的開(kāi)放域?qū)υ?,也就是“啥都能聊?/strong>。

2011年在人人網(wǎng)上橫空出世的“小黃雞”算得上是國(guó)內(nèi)最早出名的開(kāi)放域?qū)υ挋C(jī)器人,其后發(fā)展最好的當(dāng)屬微軟小冰。

開(kāi)放域?qū)υ捵畲蟮奶攸c(diǎn)是:輸入無(wú)法窮盡,導(dǎo)致輸出無(wú)法窮盡,而且對(duì)話沒(méi)有確切的結(jié)束點(diǎn),無(wú)流程可言。

我們一般情況下想去考驗(yàn)一個(gè)機(jī)器人是否智能,通??简?yàn)的就是開(kāi)放域?qū)υ?,大名鼎鼎的“圖靈測(cè)試”通常所面向的也是開(kāi)放域?qū)υ捘芰Α?/p>

從可以承載的對(duì)話輸入范圍來(lái)講,開(kāi)放域?qū)υ捪駱O了搜索引擎,我們可以在百度搜索中輸入任何的詞句,百度幾乎都會(huì)給出結(jié)果頁(yè)面(除了敏感詞);相應(yīng)的,在開(kāi)放域?qū)υ捴?,我們也是可以說(shuō)任何話,機(jī)器人也應(yīng)該每一句都可以回復(fù)。

3.2.1 開(kāi)放域?qū)υ挳a(chǎn)品設(shè)計(jì)的基本原理

對(duì)話需要的是雙方的平等。

和微軟小冰聊天時(shí),有時(shí)甚至感受不到她是真人還是假的機(jī)器——其實(shí)這并不重要,小冰正在解決開(kāi)放域聊天中一個(gè)核心的問(wèn)題:如何不斷給用戶制造話題,從而延續(xù)聊天的能量

說(shuō)到話題制造,我們先來(lái)看看開(kāi)放域?qū)υ挋C(jī)器人到底是如何制造的:

幾乎所有的開(kāi)放域?qū)υ捳Z(yǔ)料都源自于網(wǎng)絡(luò)上公開(kāi)的對(duì)話,譬如百度知道、知乎、豆瓣、貼吧等等,這些對(duì)話都是人與人形成的;那么,當(dāng)一個(gè)機(jī)器人把其中的某些話在當(dāng)時(shí)的場(chǎng)景下再說(shuō)一遍,我們是分辨不出來(lái)這個(gè)機(jī)器人是不是真人的——這便是開(kāi)放域?qū)υ挋C(jī)器人制造的基本依據(jù)。

當(dāng)我們和一個(gè)看起來(lái)像人的機(jī)器人聊天時(shí),由于場(chǎng)景發(fā)生在人與人對(duì)話的場(chǎng)景下,根據(jù)“知識(shí)詛咒”的原理,我們很容易帶入一種“對(duì)方也是人”的感覺(jué)。而一旦對(duì)方的回話像人,我們就會(huì)認(rèn)可她是人。

人與人的情感建立源自于長(zhǎng)期的交流和溝通,聊天本身就是開(kāi)放域的;所以那些樂(lè)于和機(jī)器人聊天的人類,就會(huì)越來(lái)越覺(jué)得機(jī)器人像人。

我們知道:對(duì)話機(jī)器人是一個(gè)新興的產(chǎn)品,最初嘗鮮的人是所謂的“種子用戶”,這些人建立了與機(jī)器人之間的最早形態(tài)親密感和信任感,這對(duì)后續(xù)的對(duì)話機(jī)器人發(fā)展積累了非常寶貴的經(jīng)驗(yàn)。

3.2.2 開(kāi)放域?qū)υ挋C(jī)器人的兩個(gè)產(chǎn)品陷阱

其一,面向用戶的機(jī)器學(xué)習(xí)

很多人認(rèn)為,對(duì)話機(jī)器人和人聊得越多,學(xué)習(xí)的語(yǔ)料就越多,就可以省去很多語(yǔ)料獲取的問(wèn)題,這是一個(gè)巨大的誤區(qū)。由于用戶的輸入無(wú)法預(yù)期,導(dǎo)致從用戶處采集來(lái)的語(yǔ)料千奇百怪,而且大量罵人的臟話,非常不適合作為開(kāi)放域?qū)υ捳Z(yǔ)料。由于用戶的語(yǔ)料是海量且無(wú)規(guī)則特征,導(dǎo)致語(yǔ)料清洗非??嚯y,無(wú)法使用。

其二,無(wú)人為引導(dǎo)的個(gè)性

由于開(kāi)放域的語(yǔ)料完全來(lái)自于互聯(lián)網(wǎng),所以機(jī)器人回復(fù)的話語(yǔ)帶有何種語(yǔ)氣很難把控,如果不加以認(rèn)為干預(yù),機(jī)器人說(shuō)的話會(huì)顯得時(shí)而有趣,時(shí)而刁蠻,時(shí)而無(wú)知,時(shí)而夸張,時(shí)而智慧,在用戶的心智中無(wú)法用一個(gè)或幾個(gè)明確的形容詞去形容它,這會(huì)帶來(lái)一個(gè)很尷尬的結(jié)果,用戶是抱著“調(diào)戲、戲謔”的態(tài)度去對(duì)話,長(zhǎng)此下去,想建立用戶的親密感和信任感幾乎不可能。

四、對(duì)話機(jī)器人的用戶價(jià)值

現(xiàn)在,我們?cè)噲D回答一個(gè)問(wèn)題:對(duì)話機(jī)器人為什么需要開(kāi)放域?qū)υ挘績(jī)r(jià)值是什么??jī)H僅是為了逗比有趣嗎?

這是一個(gè)非常復(fù)雜的問(wèn)題。

由于對(duì)話機(jī)器人同時(shí)具有“開(kāi)放域?qū)υ挕焙汀胺忾]域?qū)υ挕眱芍貓?chǎng)景,站在用戶視角來(lái)看,對(duì)話機(jī)器人意味著它更像人,而非機(jī)器。像人,意味著用戶會(huì)更愿意像與人交流那樣,同對(duì)話機(jī)器人進(jìn)行對(duì)話交流——而一旦如此,“個(gè)性”和“意識(shí)”便是用戶主動(dòng)強(qiáng)加于對(duì)話機(jī)器人的標(biāo)簽。譬如,幾年前被玩壞的10086短信聊天,還有《生活大爆炸》中Rajsh幻想Siri是個(gè)性感御姐,都無(wú)一例外地源自于用戶主動(dòng)強(qiáng)加于對(duì)話機(jī)器人的人性標(biāo)簽。

這便給一個(gè)可落地的對(duì)話機(jī)器人產(chǎn)品設(shè)計(jì)帶來(lái)了巨大的挑戰(zhàn)。

我們知道,任何的產(chǎn)品都是能夠和用戶產(chǎn)生親密感和信任感的,這份親密和信任是建立在產(chǎn)品體驗(yàn)之上的,是建立在“產(chǎn)品解決了核心需求”+“產(chǎn)品制造了驚喜”。我們因?yàn)閱?wèn)題解決而對(duì)一個(gè)產(chǎn)品產(chǎn)生依賴,因?yàn)轶@喜而對(duì)產(chǎn)品形成感情,打開(kāi)我們的手機(jī),我們會(huì)一眼就找到那幾個(gè)充滿親切感的產(chǎn)品——譬如經(jīng)常開(kāi)車的人會(huì)十分信任高德地圖,追劇《那年花開(kāi)月圓時(shí)》的人會(huì)十分喜愛(ài)騰訊視頻。

同理,機(jī)器人需要有基礎(chǔ)個(gè)性,需要極大地拉近人與機(jī)器人之間的親密感和信任感。對(duì)話機(jī)器人的親密感和信任感建立,也是站在“解決了需求”和“制造了驚喜”兩個(gè)方面。

站在產(chǎn)品的視角來(lái)看,解決需求通過(guò)封閉域?qū)υ捦瓿?,而開(kāi)放域?qū)υ拋?lái)不斷制造驚喜。

4.1 問(wèn)答、助理、聊天,哪個(gè)才是剛需?

已經(jīng)在落地的對(duì)話機(jī)器人產(chǎn)品中,基本上是以純to C和to B再to C來(lái)劃分。由于對(duì)話機(jī)器人的交互特征是面向終端用戶的,所以基本很少有純to B的產(chǎn)品場(chǎng)景(即使有,它的邏輯也與to C邏輯相似)。這意味著,對(duì)話機(jī)器人的用戶都是一些終端個(gè)人用戶。

那么,我們來(lái)看看這些對(duì)話機(jī)器人在to C中,到底解決了怎樣的核心需求。

在我們所知的對(duì)話機(jī)器人產(chǎn)品中,有主打客服的問(wèn)答機(jī)器人,有主打秘書的助理機(jī)器人,還有純?nèi)の秾?dǎo)向的聊天機(jī)器人,它們的背后,都是剛需嗎?

4.1.1 一個(gè)事實(shí):瞎聊難為剛需,情感計(jì)算任重道遠(yuǎn)

聊天是一個(gè)容易被激發(fā),卻也容易迅速消退的場(chǎng)景,唯有情感依賴可能長(zhǎng)久。

以微軟小冰為例。小冰最耳熟能詳?shù)墓δ苁莄hit-chat(瞎聊),但是從用戶活躍和留存周期來(lái)看,用戶最易被激發(fā)的時(shí)間是在首次領(lǐng)養(yǎng)時(shí)、每周更新時(shí)、重大更新時(shí),而且被激發(fā)后,活躍上升后就會(huì)很快下降。這是為什么呢?因?yàn)槿伺c機(jī)器之間的對(duì)話聊天是基于趣味話題的,想要通過(guò)自然的情感依賴,成為像《HER》里面的Samantha,至少還有相當(dāng)長(zhǎng)的路要走。

情感計(jì)算并非只是一個(gè)數(shù)學(xué)或者計(jì)算機(jī)科學(xué)問(wèn)題,更是一個(gè)產(chǎn)品問(wèn)題。

由于情感并非一個(gè)可具象問(wèn)題,而且人的情感變化會(huì)隨著時(shí)間、環(huán)境、他人、自身思想等等因素發(fā)生變化;而且情感并非連續(xù)的計(jì)算,你喜歡一個(gè)女孩子,并不意味著時(shí)時(shí)刻刻與她發(fā)生情感依賴,而是通過(guò)一些關(guān)鍵的情感觸達(dá),來(lái)完成情感連接。

在微軟小冰的諸多被設(shè)計(jì)的Feature中,“給用戶起外號(hào)”、“升級(jí)解鎖”都是斷點(diǎn)式情感觸達(dá),通過(guò)細(xì)微的產(chǎn)品設(shè)計(jì),寄希望于黏住用戶。

4.1.2 一個(gè)問(wèn)題:用戶真的需要一個(gè)秘書機(jī)器人嗎?

助理型對(duì)話機(jī)器人的發(fā)展建立在其他各種線上線下服務(wù)的完善基礎(chǔ)上,譬如Siri;只有當(dāng)你手機(jī)里已經(jīng)有了“鬧鐘”、“提醒”、“打電話”、“搜索引擎”等功能時(shí),Siri的助理功能才能發(fā)揮效用,此時(shí)你才有可能面向Siri發(fā)出指令“提醒我明天8點(diǎn)給老板回微信”。

大概兩年前,YC孵化的Magic轟動(dòng)?xùn)|西兩個(gè)半球,無(wú)數(shù)效仿者爭(zhēng)先恐后去探索“助理型”機(jī)器人,時(shí)至今日,鮮有成效——我們普通人真的需要一個(gè)像秘書一樣的對(duì)話機(jī)器人嗎?

我們先來(lái)看兩個(gè)例子。

第一個(gè)例子——我想定個(gè)這樣的鬧鐘“每周一、周三、周五的上午8:15”。

若我用iPhone的鬧鐘程序,那我的步驟會(huì)大致如下:

  • STEP1:解鎖手機(jī)屏幕;
  • STEP2:左右滑屏,找到鬧鐘程序;
  • STEP3:點(diǎn)擊鬧鐘程序;
  • STEP4:點(diǎn)擊新建鬧鐘;
  • STEP5:選擇鬧鐘時(shí)間為“上午8:15”;
  • STEP6:選擇重復(fù)時(shí)間為“周一、周三、周五”;
  • STEP7:點(diǎn)擊完成。

若我選用Siri幫我來(lái)做,那我的步驟大致會(huì)如下:

  • STEP1:長(zhǎng)按Home鍵,喚醒Siri;
  • STEP2:對(duì)Siri說(shuō)“幫我設(shè)定每周一、周三、周五上午8:15的鬧鐘”;
  • STEP3:Siri反饋設(shè)置成功,完成。

現(xiàn)在我們看第二個(gè)例子——通過(guò)秘書類對(duì)話機(jī)器人叫外賣 VS 通過(guò)“餓了么”叫外賣。

在秘書類機(jī)器人中,叫外賣的流程大致是這樣的:

  • STEP1:發(fā)出“叫外賣”的指令,在機(jī)器人推薦的餐廳中,尋找想吃的那家
  • STEP2:如果沒(méi)有合適的,就輸入想吃的店家名字
  • STEP3:在推薦的列表中選中想吃餐,或者直接輸入想吃的餐
  • STEP4:輸入“確認(rèn)”實(shí)現(xiàn)下單,輸入訂單信息并提交訂單
  • STEP5:支付,并等待接收外賣,可以詢問(wèn)送餐進(jìn)度

在餓了么中,叫外賣的流程大致是這樣的:

  • STEP1:在餐廳列表中選擇想吃哪家
  • STEP2:如果沒(méi)有合適的,就搜索店家
  • STEP3:在推薦的列表中選中想吃餐,或者直接輸入想吃的餐
  • STEP4:確認(rèn)下單,確認(rèn)訂單信息,提交訂單
  • STEP5:支付,并等待接收外賣,可以查看送餐進(jìn)度

這兩個(gè)例子有什么本質(zhì)區(qū)別嗎?

你會(huì)發(fā)現(xiàn),如果通過(guò)Siri來(lái)設(shè)置鬧鐘,我其實(shí)只做了一件事情:對(duì)著Siri發(fā)出一個(gè)單條指令,然后就一切搞定——相比我通過(guò)App來(lái)做,節(jié)省了近乎70%的操作步驟??墒?,如果是叫外賣,我需要對(duì)著機(jī)器人發(fā)出一組系列指令,但是和App的操作步驟一樣多。

這里有兩個(gè)關(guān)鍵點(diǎn)——

  1. 如果助理機(jī)器人可以一步到位,那么將極大地提升效率和體驗(yàn),是新的需求升級(jí);
  2. 若一個(gè)workflow可被一步解決,機(jī)器人需要補(bǔ)全的數(shù)據(jù)信息巨大,這是核心產(chǎn)品難點(diǎn);

第一個(gè)關(guān)鍵點(diǎn),我們只要設(shè)身處地地想一下,就會(huì)發(fā)現(xiàn):在不考慮語(yǔ)音識(shí)別準(zhǔn)確率的前提下,任何事情我只要一個(gè)指令就可以達(dá)成。譬如“幫我叫個(gè)車”、“幫我交份外賣”、“幫我交一下水電費(fèi)”、“幫我定一下出差的機(jī)票”,其他都不用管了,這種體驗(yàn)簡(jiǎn)直贊爆了。

我們?cè)倏纯吹诙€(gè)關(guān)鍵點(diǎn)。

就拿上面這個(gè)外賣的例子來(lái)看,如果用戶只需要一句“幫我叫個(gè)外賣”即可,那么機(jī)器人需要補(bǔ)全的信息至少包括“餐廳”、“餐食”、“價(jià)格”、“送餐時(shí)間”、“送餐地點(diǎn)”、“支付信息”等,這些信息中的“送餐時(shí)間、送餐地點(diǎn)、支付信息”是相對(duì)靜態(tài)的信息,獲取一次就可長(zhǎng)期使用??墒恰安蛷d、餐食、價(jià)格”則是動(dòng)態(tài)信息,若想每次都可自動(dòng)獲取,則代表機(jī)器人需要非常了解這位“主人用戶”才可以,否則只要有一兩次推薦偏差太大,體驗(yàn)就會(huì)降低近乎一個(gè)量級(jí)。從本質(zhì)上來(lái)說(shuō),這時(shí)的助理機(jī)器人已是一款強(qiáng)大的推薦引擎,而且代表了極佳的魅力和美好的發(fā)展未來(lái)。

4.1.3 一個(gè)肯定:?jiǎn)柎饳C(jī)器人是很有價(jià)值的

最常見(jiàn)的問(wèn)答機(jī)器人是“客服機(jī)器人”,譬如京東的JIMI,阿里的小蜜機(jī)器人,還有一些銀行的客服機(jī)器人,但它們更像FAQ過(guò)濾器。

我們細(xì)想一下阿里小蜜的使用場(chǎng)景。如果我問(wèn)阿里小蜜“我的快遞怎么還沒(méi)送到?”,它的回復(fù)方式本質(zhì)是在常見(jiàn)的關(guān)于“快遞”的問(wèn)題中,把最常見(jiàn)的答案丟給我,比如它會(huì)告訴我“你的快遞已經(jīng)簽收了,如果沒(méi)收到可能是放到大門口了”。

這些企業(yè)為什么要做個(gè)問(wèn)答機(jī)器人呢?效率自然是第一位的,無(wú)論是節(jié)約人工客服成本,或是節(jié)約溝通時(shí)間,帶來(lái)的都是效率的提升。這些企業(yè)為什么如此看重效率呢?因?yàn)樗麄兊目蛻羰亲钯N近自己的利潤(rùn)池的,品控是所有交易型企業(yè)的核心,你看京東的用戶客服和QQ的用戶客服簡(jiǎn)直一個(gè)天上一個(gè)地下,原因就是京東用戶是京東現(xiàn)金流的關(guān)鍵角色,而QQ的普通用戶并非其現(xiàn)金流業(yè)務(wù)的關(guān)鍵角色。

如此,我們?cè)倩剡^(guò)頭來(lái)看看問(wèn)答機(jī)器人,它其實(shí)是在頭部問(wèn)題上實(shí)現(xiàn)了綜合過(guò)濾,然后通過(guò)對(duì)話的形式反饋給用戶,如果用戶實(shí)在問(wèn)的是長(zhǎng)尾問(wèn)題,問(wèn)答機(jī)器人回答不了的,可以把問(wèn)題再拋給人工客服。滿足了用戶九成以上問(wèn)題的直接答復(fù),是問(wèn)答機(jī)器人的核心目標(biāo)。而至于其他類似導(dǎo)購(gòu)、協(xié)助訂單管理等等,不過(guò)是附加在頭部問(wèn)題之上的增值體驗(yàn)優(yōu)化。

4.2 對(duì)話機(jī)器人真的適合分為“聊天、助理、問(wèn)答”這三類嗎?

這是一個(gè)目前業(yè)內(nèi)比較慣用的分類,我們來(lái)看看這個(gè)分類的視角。

  • 如果站在技術(shù)視角來(lái)看,對(duì)話機(jī)器人應(yīng)該分為“開(kāi)放域”和“封閉域”,這個(gè)我們已經(jīng)聊過(guò)了,這里不再贅述。
  • 如果是站在用戶角色來(lái)看,對(duì)話機(jī)器人可能分為“教育版本”、“醫(yī)療版本”、“二次元版本”等等。
  • 如果是站在業(yè)務(wù)視角來(lái)看,對(duì)話機(jī)器人可以分為純To C和To B再To C。

所以,這種分類更像是站在抽象場(chǎng)景視角來(lái)看的。幾乎任何場(chǎng)景都會(huì)被劃分到這三個(gè)類別中,要么無(wú)主題聊天,要么是任務(wù)導(dǎo)向,要么是提問(wèn)解答。其實(shí),倒過(guò)來(lái)看,幾乎所有我們已知的App也被這個(gè)分類所覆蓋了。

可是,對(duì)話機(jī)器人不是一個(gè)移動(dòng)互聯(lián)網(wǎng)時(shí)代的App,它是一個(gè)綜合體,直接這樣劃分并不是一個(gè)好的產(chǎn)品分類。

你不會(huì)在淘寶里視頻聊天,更不會(huì)在支付寶里侃大山,百度幾年前試圖在大搜索中推出“直達(dá)號(hào)”去顛覆微信公眾號(hào),結(jié)果以失敗告終。

這個(gè)道理很簡(jiǎn)單:在移動(dòng)互聯(lián)網(wǎng)時(shí)代,幾乎每個(gè)App都有自己的專屬定位。有自己專屬的產(chǎn)品主路徑,不在自己路徑邏輯中的行為是不能順暢流轉(zhuǎn)的;每個(gè)App都像有自己的緊箍咒,不能輕易破除互相之間的壁壘。

可是,在對(duì)話機(jī)器人產(chǎn)品的世界里,這些壁壘會(huì)瓦解。

如果我們站在互聯(lián)網(wǎng)整體產(chǎn)品世界里來(lái)看,其實(shí)我們每個(gè)人生活在一個(gè)混在的江湖社會(huì)中,手頭的各種工具幫我們實(shí)現(xiàn)一個(gè)個(gè)小任務(wù)目標(biāo),但是幾乎每一件小事都需要與人打交道,衣食住行無(wú)一例外。如果每一次與外界的接觸被看做一個(gè)流量的話,那么最大的流量便是頻繁且無(wú)實(shí)際任務(wù)目的的人與人之間的交互,而相對(duì)較小的是去做一個(gè)個(gè)的具體任務(wù)事情:你會(huì)每天都見(jiàn)一些人,但你不會(huì)天天都買衣服。

幾乎所有的流量都是圍繞著人與人之間的交互而形成的,而且你會(huì)發(fā)現(xiàn)一個(gè)規(guī)律:離現(xiàn)金流越近的流量,其活躍性越低,而且流失率越高。騰訊系的產(chǎn)品、百度的產(chǎn)品都是通過(guò)流量漏斗來(lái)多元變現(xiàn)的,而阿里系的產(chǎn)品,是直接拉人來(lái)買東西,盈利空間就直接建立在交易之上,需要不斷刺激人們買買買。

在所有的產(chǎn)品中,社交類產(chǎn)品是最貼近“江湖社會(huì)”的,它距離現(xiàn)金流是最遠(yuǎn)的,也是最活躍的,可以說(shuō)是幾乎所有互聯(lián)網(wǎng)產(chǎn)品中活躍度最高,并且可以向任何產(chǎn)品導(dǎo)流的源流量產(chǎn)品,所以你看到了,阿里無(wú)所不用其極地想去做社交產(chǎn)品。

說(shuō)了一圈,那么我們回來(lái)看看社交產(chǎn)品的最小雛形。

社交產(chǎn)品分為即時(shí)社交和延時(shí)社交,簡(jiǎn)單類比就是聊天和朋友圈,而這兩個(gè)都是建立在“語(yǔ)言對(duì)話”的基礎(chǔ)上。由于社交產(chǎn)品的場(chǎng)景中幾乎可以做任何事情,前段時(shí)間網(wǎng)上流傳的微信“發(fā)現(xiàn)”頁(yè)面那張神圖,就可見(jiàn)一斑。

微信“發(fā)現(xiàn)”頁(yè)面網(wǎng)絡(luò)神圖

對(duì)話機(jī)器人具有社交產(chǎn)品的通性,原因只有一個(gè)——對(duì)話機(jī)器人的交互場(chǎng)景天然就是一個(gè)社交產(chǎn)品的交互場(chǎng)景

當(dāng)我們站在用戶視角來(lái)看待對(duì)話機(jī)器人時(shí),用戶根本不理解什么是“開(kāi)放域、封閉域”,也不了解什么是“聊天機(jī)器人、助理機(jī)器人、問(wèn)答機(jī)器人”,用戶也記不住那些分類,也沒(méi)法記住,只要有一個(gè)對(duì)話輸入框擺在用戶面前,就像微信的輸入框那樣,由于知識(shí)詛咒的原因,用戶就會(huì)去類比他所理解的對(duì)話輸入框,就會(huì)在這里輸入任何他們想輸入的自然語(yǔ)言,可能是瞎聊的話,也可能是某個(gè)任務(wù),也可能是提一個(gè)問(wèn)題,我們根本不能阻止用戶在面對(duì)京東JIMI機(jī)器人時(shí)不做瞎聊的操作。

這時(shí)帶來(lái)的一個(gè)巨大難題就是,開(kāi)放域?qū)υ挄?huì)時(shí)有發(fā)生,而只要一次兩次回答不佳,體驗(yàn)不滿就會(huì)提升。站在產(chǎn)品設(shè)計(jì)的角度來(lái)說(shuō),我們能做的就是盡量讓用戶的輸入是可控的,就像度秘、阿里小蜜已經(jīng)在做的。這就是為什么,每當(dāng)我們?nèi)ピO(shè)計(jì)對(duì)話機(jī)器人時(shí),總是要設(shè)法去多涉及一些開(kāi)放域?qū)υ挼墓δ茳c(diǎn),也是為什么每當(dāng)我們談起對(duì)話機(jī)器人時(shí),卻也總是繞不開(kāi)“機(jī)器人在開(kāi)放域下是不是智能”這個(gè)問(wèn)題

4.3 像朋友一樣的伙伴會(huì)是對(duì)話機(jī)器人的終局嗎?

如果你在微信上,問(wèn)你最好的朋友“幫我看看有沒(méi)有戰(zhàn)狼2的票,我晚上想去看”,他/她會(huì)如何回答你?

我猜,他可能會(huì)說(shuō)“你去看《戰(zhàn)狼2》不叫我?!”,他可能還會(huì)說(shuō)“我也去,咱倆一塊兒去”,然后他會(huì)繼續(xù)說(shuō)“我看了下,你家跟前那家萬(wàn)達(dá)有票,晚上七點(diǎn)的,下班一塊兒去?”

如果一樣的問(wèn)題問(wèn)Magic呢?它的回答就是讓你告訴他幾點(diǎn)去看,它幫你挑選了五家,每家的時(shí)間都挺合適,有一些距離你近,有些有優(yōu)惠,等等。

你喜歡哪種體驗(yàn)?zāi)兀窟@個(gè)其實(shí)很難說(shuō)。如果站在封閉域的角度來(lái)說(shuō),Magic的算法要比朋友優(yōu)很多,選擇也更豐富,可是和朋友一起去的這種體驗(yàn),才是生活。

我認(rèn)為這個(gè)可能是對(duì)話機(jī)器人的終局,它存在的意義仍然是協(xié)助人們?nèi)ジ玫亟鉀Q一系列問(wèn)題;但是它不能太傻,像個(gè)指令機(jī)一樣待在那里,而是應(yīng)該像個(gè)朋友一樣懂你卻也能幫你。以前在對(duì)話機(jī)器人產(chǎn)品的討論中還經(jīng)常討論:對(duì)話機(jī)器人應(yīng)該更“有趣”還是更“有用”,其實(shí)從這個(gè)終局來(lái)看這個(gè)討論毫無(wú)意義,你能說(shuō)你的朋友只有用,但是無(wú)趣嗎?

五、對(duì)話機(jī)器人的產(chǎn)品價(jià)值

上面關(guān)于對(duì)話機(jī)器人的用戶價(jià)值的討論,有一些發(fā)散了,我們收攏回來(lái),聊整個(gè)文章的最后一個(gè)部分,關(guān)于其產(chǎn)品的價(jià)值。?

對(duì)待產(chǎn)品,一定要從其商業(yè)視角出發(fā),不然沒(méi)有聊的意義。站在商業(yè)視角,對(duì)話機(jī)器人擁有三個(gè)方面最核心的產(chǎn)品價(jià)值。

5.1 跨場(chǎng)景連接成為可能

由于對(duì)話機(jī)器人的交互方式原始而單一,使得機(jī)器人背后所有的計(jì)算邏輯都被隱藏,機(jī)器人可以成為一個(gè)獨(dú)立的橋梁連接不同場(chǎng)景下的服務(wù),讓用戶只在一個(gè)對(duì)話場(chǎng)景下都可以完成交互。

譬如Skype for business中,就有一個(gè)機(jī)器人,幫助通過(guò)Skype做協(xié)同的人們預(yù)定會(huì)議室、設(shè)置工作項(xiàng)目提醒、代理自動(dòng)回復(fù)等等——原本每個(gè)工作都是跨場(chǎng)景的,現(xiàn)在只要一個(gè)對(duì)話交互場(chǎng)景就可以解決了。如果再往大了去說(shuō),未來(lái)如果伙伴式的機(jī)器人可以逐漸出現(xiàn),那在聊天中完成訂機(jī)票、訂酒店,甚至管理家里的智能空調(diào),這些跨場(chǎng)景可能通過(guò)一個(gè)伙伴都可以完成了。

5.2 交互升級(jí)帶來(lái)的流量深度沉淀

對(duì)話的方式有很多,可以是打字,也可以是語(yǔ)音。如果是語(yǔ)音,那么帶來(lái)的是革命性地變化。

5.2.1 指數(shù)級(jí)的流量增長(zhǎng)

百度DuerOS和Amazon Alexa的邏輯是相似的,都是通過(guò)賦予所有智能硬件語(yǔ)音對(duì)話的能力,進(jìn)而獲取新流量,同時(shí)實(shí)現(xiàn)流量的深度交互和沉淀。

我們知道,在互聯(lián)網(wǎng)的生意經(jīng)中,一切都是圍繞著流量來(lái)完成的,要么是流量足夠多,要么流量的價(jià)值足夠大。由于對(duì)話帶來(lái)的交互效率提升,使得在單個(gè)用戶身上獲取的流量頻次呈現(xiàn)指數(shù)級(jí)增長(zhǎng),如果一般的互聯(lián)網(wǎng)產(chǎn)品PV/UV是個(gè)位數(shù)的話,那么對(duì)話機(jī)器人的PV/UV(其實(shí)就是對(duì)話的頻次)至少是兩位數(shù)。

一些曾經(jīng)很難成為交互場(chǎng)景的,譬如在家里面向Echo音箱發(fā)號(hào)施令,如今都通過(guò)對(duì)話機(jī)器人成為現(xiàn)實(shí)。沒(méi)有任何一款A(yù)pp能比一個(gè)對(duì)話機(jī)器人更容易和人產(chǎn)生親密感,產(chǎn)生如此多高頻互動(dòng)的可能。最后的結(jié)果可能就是,我們的生活方方面面都在觸網(wǎng),每一次交互就是一次所謂的PV,指數(shù)級(jí)的流量映射出一個(gè)人生活的方方面面。

5.2.2 高頻次的端計(jì)算

我有一個(gè)猜測(cè):由于對(duì)話機(jī)器人是一個(gè)高頻次交互場(chǎng)景,帶來(lái)的最直接影響可能是要求在設(shè)備端上擁有更加強(qiáng)大的計(jì)算能力;可能一些封閉域或者開(kāi)放域的計(jì)算能力直接預(yù)加載到了客戶端,可能是硬件也可能是軟件。如果網(wǎng)絡(luò)能力不能同樣倍數(shù)增長(zhǎng)的話,對(duì)于端的計(jì)算能力會(huì)增強(qiáng)——我猜這也是為什么一些AI企業(yè)會(huì)做芯片的原因之一。

5.3 流量沉淀帶來(lái)的數(shù)據(jù)深耕

正是由于流量的深度沉淀,使得每個(gè)用戶多維的數(shù)據(jù)沉淀成為可能。當(dāng)平均每個(gè)用戶的數(shù)據(jù)量和維度增長(zhǎng)十倍,那么到底意味著什么呢?

對(duì)于百度而言,起碼廣告費(fèi)要漲價(jià),對(duì)于阿里而言,可以賣給這個(gè)用戶更多的東西,總而言之,ARPU(Average Revenue per User)會(huì)增長(zhǎng)許多,這些就是最直接的商業(yè)價(jià)值。我在之前的文章《人工智能「風(fēng)口」,先行者為什么是搜索引擎?》中,曾分析過(guò)這其中的一些邏輯關(guān)系,因?yàn)榱髁康纳罹S度價(jià)值尚未被開(kāi)發(fā),對(duì)于計(jì)算廣告而言可能是一塊從未嘗鮮的處女地。

六、總結(jié)

如上是我針對(duì)對(duì)話機(jī)器人的一些比較淺顯的分析和探討,作為一款正在發(fā)展的新興產(chǎn)品,對(duì)話機(jī)器人還有非常多的細(xì)節(jié)值得探討;限于篇幅,只能先聊這么多了,希望以后還能繼續(xù)深入探討。

從個(gè)人層面來(lái)說(shuō),我看好To C的對(duì)話機(jī)器人產(chǎn)品的未來(lái)——但是它的產(chǎn)品路徑非常曲折漫長(zhǎng),與我們過(guò)往所經(jīng)歷的移動(dòng)互聯(lián)網(wǎng)產(chǎn)品差異巨大;但是萬(wàn)變不離其宗,任何產(chǎn)品都是從用戶的需求出發(fā)的。

對(duì)話機(jī)器人承載了全新的交互形式,可能帶來(lái)了全新的產(chǎn)品服務(wù)體驗(yàn),這種進(jìn)步過(guò)去從來(lái)沒(méi)有過(guò)。

我們每個(gè)人幾乎都在渴望著機(jī)器人時(shí)代的到來(lái),也許很遙遠(yuǎn),也許已經(jīng)在路上,誰(shuí)知道呢~

#專欄作家

趙帥,“優(yōu)護(hù)家” 聯(lián)合創(chuàng)始人兼COO;前微軟小冰初創(chuàng)團(tuán)隊(duì)產(chǎn)品經(jīng)理;北京大學(xué)計(jì)算機(jī)系碩士。專注產(chǎn)品、運(yùn)營(yíng)和商業(yè)的分析,熱衷產(chǎn)品方法論的總結(jié)。熱愛(ài)足球、民謠音樂(lè)、吉他彈唱、軟筆書法、閱讀和旅游,熱愛(ài)生活。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 我是被“深度解析”這個(gè)標(biāo)題吸引進(jìn)來(lái)的,結(jié)果看完了結(jié)論是“一些比較淺顯的分析和探討”、“希望以后還能繼續(xù)深入探討” ?

    來(lái)自浙江 回復(fù)
  2. “這就是一個(gè)典型的封閉域多倫問(wèn)答對(duì)話”
    有錯(cuò)別字
    是多輪不是多倫

    來(lái)自浙江 回復(fù)
  3. 這是一篇思路有點(diǎn)混亂的,貌似有邏輯的,可以機(jī)器人合成的,偽科普的,產(chǎn)品文章。。。。
    飄過(guò)~~~

    來(lái)自北京 回復(fù)
  4. 我覺(jué)得秘書機(jī)器人還是需要的,現(xiàn)在的手機(jī)就是一個(gè)實(shí)實(shí)在在的秘書機(jī)器人硬件,軟件和硬件加起來(lái)的復(fù)雜交互,有時(shí)真的希望更簡(jiǎn)單一些,明明對(duì)話就可以完成,不需要那么多的操作。

    來(lái)自廣東 回復(fù)
  5. 搜索場(chǎng)景下輸入能耗較大,此處不甚理解,因?yàn)橄噍^于搜索框,我覺(jué)得對(duì)話框更耗費(fèi)精力,如果方便的話,可否點(diǎn)撥一下,謝謝

    來(lái)自廣東 回復(fù)
  6. 全面接地氣,希望看到更多關(guān)于微軟小冰設(shè)計(jì)的想法和實(shí)踐

    來(lái)自廣東 回復(fù)
  7. 近3個(gè)月以來(lái),看到的最好最細(xì)最全最接地氣的一篇關(guān)于語(yǔ)音交互的文章,看過(guò)《她》,很深刻,作為產(chǎn)品經(jīng)理,終極目標(biāo)是實(shí)現(xiàn)《她》

    來(lái)自廣東 回復(fù)