和機(jī)器人交互,哪些是本質(zhì),哪些不是
自從人類發(fā)明了計算機(jī),就持續(xù)面臨著一個根本性問題:我們到底應(yīng)該如何與這類機(jī)器交互?拋開具體交互形式不論,顯然地,我們和機(jī)器的交互方式上經(jīng)歷了一個從人適應(yīng)機(jī)器,到機(jī)器適應(yīng)人的過程。一旦趨勢切換為機(jī)器應(yīng)該如何適應(yīng)人,那看待語音交互等最終趨勢的的根本視角從來就不應(yīng)該是機(jī)器能做什么,而是說人更渴望什么。
人機(jī)交互簡史
自從計算機(jī)發(fā)明后,它所能接受的輸入本質(zhì)上就沒發(fā)生任何變化,始終都是類似加減乘除移位這樣的指令。我們經(jīng)常說的紙帶其實(shí)并不是交互方式本身,而只是一種載體,紙帶上面就是具體需要計算機(jī)執(zhí)行的指令。在那個時代,人是要完全適應(yīng)機(jī)器的,所以必須學(xué)會機(jī)器的語言,程序員則相當(dāng)于掌握了機(jī)器語言的翻譯。
同樣道理鍵盤也不是一種交互方式,而是一種輸入設(shè)備,真正的交互方式其實(shí)是命令,常見的比如mkdir這類命令其實(shí)可以看成是更多指令的集合,但抽象的級別更高了,可以完成建立目錄這類功能。這個時候,其實(shí)也還是人在適應(yīng)機(jī)器,但開始去除人機(jī)交互過程中一些繁瑣重復(fù)的事情,讓人機(jī)交互變的更為便利。
此后的圖形用戶界面是一個關(guān)鍵轉(zhuǎn)折,圖形用戶界面讓人機(jī)交互徹底的向人類一方遷移,屏蔽掉了幾乎所有和機(jī)器相關(guān)的細(xì)節(jié)。在Windows下唯一還保留了些機(jī)器特征的東西,只是開機(jī)、關(guān)機(jī)、拷貝、粘貼、查找、最大化、最小化、關(guān)閉等少數(shù)幾個命令,其它部分則和我們操作物理世界的東西很像,比如我們需要選擇一樣?xùn)|西的時候,我們通常會把他們排成一排,而不管開始菜單還是任務(wù)欄都是這樣做的。同樣是圖形用戶界面,從使用鼠標(biāo)到觸屏內(nèi)部還是有進(jìn)展,導(dǎo)入觸屏之后機(jī)器的細(xì)節(jié)被進(jìn)一步拋棄,最大化、最小化這些事進(jìn)一步消失,而只剩下App的排列以及選擇,我們最常用的操作只是點(diǎn)擊和滑動。所以我們可以說從鼠標(biāo)到手指其實(shí)是進(jìn)一步向人這端遷移。
這背后本質(zhì)的推動力其實(shí)是計算能力的富余,但產(chǎn)品設(shè)計者們不再把這部分富余計算能力只是用來提高性能,而是用來適應(yīng)人的操作習(xí)慣,所以圖形用戶界面可以看成是從人適應(yīng)機(jī)器到機(jī)器人適應(yīng)人的轉(zhuǎn)折點(diǎn)。這其實(shí)沒什么奇怪,畢竟人類是世界的中心,所以只要有可能那就必然走到機(jī)器適應(yīng)人的方向上來。
過去不管是用紙帶直接輸入指令還是用命令行乃至于使用圖形用戶界面,其內(nèi)部是逐步遞進(jìn)的,雖然表面看差異很大,但基于的是同樣的命令體系,只是在便利性上有較大提升,并沒有導(dǎo)入很多的新東西。
語音交互則與此不同,它一方面集成了老的命令系統(tǒng),比如你可以說調(diào)大音量、下一頁、設(shè)定十點(diǎn)的鬧鐘等。這時候它體現(xiàn)的只是人機(jī)交互方式進(jìn)一步向人這端傾斜,提升便利性,這與圖形用戶界面帶來的變化是一致的。但另一方面它則為交互方式注入了智能屬性,這種智能屬性讓機(jī)器進(jìn)行更多的決策,交互不再是精確的,比如放一首歌,這在過往的交互方式下是不能實(shí)現(xiàn)的。這是兩種完全不同的屬性,前者會讓存量市場進(jìn)行升級,也就是說只要便利性有價值,那怕沒什么智能它也是可以落地的,后者則體現(xiàn)新的信息整合和輸出方式,會帶來極大的顛覆性。
交互方式背后隱含的顛覆性
交互方式的改進(jìn)如果只是帶來純粹便利性那就只是一個更好的功能,但如果這種交互方式影響了信息的整合與輸出方式,那就會對行業(yè)產(chǎn)生顛覆性影響。典型的就是觸屏對搜索的影響,在鼠標(biāo)的模式下,搜索是互聯(lián)網(wǎng)的中心,但因?yàn)橛|摸不能精確定位,進(jìn)一步催生了App,這直接導(dǎo)致了搜索的中心地位被削弱。
那顯然的注入了智能屬性的語音交互一定會導(dǎo)致信息整合和輸出方式的再次更迭,那這會對眼下已經(jīng)日趨穩(wěn)定的互聯(lián)網(wǎng)生態(tài)帶來什么影響?
從現(xiàn)象上看,第一個最直接的影響是App又會消失了,信息的整合與輸出看起來似乎會經(jīng)歷一個分久必合,合久必分的過程。圖形用戶界面的鼠標(biāo)時代,信息的整合與輸出其實(shí)是大一統(tǒng)的,基本上就是瀏覽器與搜索引擎,然后大的客戶端程序維持一定自己的空間(比如QQ)。圖形用戶界面的觸摸屏?xí)r代,信息的整合與輸出其實(shí)是分散化的,人們得記住自己要什么然后裝特定的App。語音交互則是更加大一統(tǒng)的,沒有App,同時也不會再有和瀏覽器相并列的大客戶端,有的只是輸入的一句句話。
什么樣技術(shù)趨勢就會導(dǎo)致什么樣的格局。形象講我們可以認(rèn)為搜索、電商、IM的格局是先天內(nèi)置在行業(yè)里面的,然后才是誰是搜索的王者,誰是電商的王者。
在PC時代瀏覽器和搜索處于核心地位,所以就會有Google這樣的巨頭,其它人都要活在它的陰影下面。而一旦信息的整合與輸出再一次大一統(tǒng)化,那就一定會催生新的大號統(tǒng)治者,而這種大號統(tǒng)治者的出現(xiàn),實(shí)質(zhì)上意味著現(xiàn)有的巨頭或者小巨頭會被削弱。如果沒有了App,對于O2O、甚至出行等誰掌握了上層的控制權(quán),誰就掌握了他們的命脈。
終局看來就會是這樣,但這個過程現(xiàn)在來看會非常漫長。
未來三年的交互方式發(fā)展
交互方式的發(fā)展一定依賴于具體產(chǎn)品的銷售狀態(tài),而終端產(chǎn)品的銷售起量則有兩種模式:一種是智能手機(jī)式的,一種則是MP3式的。
智能手機(jī)的啟動進(jìn)程顯然和蘋果有巨大的關(guān)系,蘋果先推出一款標(biāo)桿產(chǎn)品,然后迅速出現(xiàn)大量的模仿者,最終市場大幅啟動。在手機(jī)上整個過程歷時4~5年。MP3則與此不同,先是出現(xiàn)各種形狀的MP3,沒有領(lǐng)頭羊,市場也啟動了,然后蘋果出了一款體驗(yàn)遠(yuǎn)超其它人的產(chǎn)品。
對語音交互的發(fā)展而言,我們同樣面臨兩種可能性:一種是有人做出了一款足夠爆款的產(chǎn)品,讓語音交互的落地有一個符號性的標(biāo)志,然后類似產(chǎn)品持續(xù)跟進(jìn),產(chǎn)品品類持續(xù)拓寬;一種是沒什么標(biāo)志性的產(chǎn)品,但交互方式極為寬泛的不停的在各個行業(yè)進(jìn)行滲透,累積到一定程度再出各種標(biāo)志性產(chǎn)品。在國外顯然走的是第一條路線,其中Amazon Echo扮演了領(lǐng)頭羊角色。在國內(nèi)則暫時還看不到這樣一個角色,越來越往MP3的走勢偏移。
具體來講,如果是有人扮演領(lǐng)頭羊的角色,那市場會在領(lǐng)頭羊之后高速推開,因?yàn)榻换シ绞降囊磺屑?xì)節(jié)都會在領(lǐng)頭羊身上得到驗(yàn)證,各個公司不會有任何疑慮,但如果是沒有領(lǐng)頭羊的模式,那整個進(jìn)程就會拖的比較漫長。
也就是說,未來三年交互方式的發(fā)展,最終會依賴于我們實(shí)質(zhì)上會走到那條道路上來,眼下來看后者的可能性在升高,因?yàn)轭I(lǐng)頭羊這種事,事實(shí)上是具有極大偶然性的,喬布斯這種人是非常難以復(fù)制的,其信徒們似乎都走上了邯鄲學(xué)步的套路。
小結(jié)
在過去,誰敢說自己是下一個BAT,其實(shí)是會被鄙視的,因?yàn)榭陀^條件就不具備,小魚塘里那會出現(xiàn)鯨魚。但現(xiàn)在交互方式似乎真的提供了這么一個機(jī)會,核心的問題是BAT等其實(shí)也這么想,所以這種顛覆性更可能只是巨頭間勢力的再分配。
作者:李智勇,聲智科技合伙人&副總裁,微信公眾號:琢磨事(ID:zuomoshi)
本文由 @李智勇 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Pixabay,基于 CC0 協(xié)議
- 目前還沒評論,等你發(fā)揮!