增強(qiáng)現(xiàn)實(shí)的權(quán)力江湖

0 評(píng)論 9072 瀏覽 24 收藏 24 分鐘

這篇文章是基于Mark Domino?和Jasper Speicher 2009?年的談話升華而成?,F(xiàn)在盡管硬件方面有所進(jìn)步,但和那時(shí)候相比并沒(méi)多大改變。

現(xiàn)在我給出一個(gè)結(jié)論:增強(qiáng)現(xiàn)實(shí)的發(fā)展很像早期的互聯(lián)網(wǎng)。增強(qiáng)現(xiàn)實(shí)正處于潛在的變革上,也面臨著和早期互聯(lián)網(wǎng)相同的問(wèn)題。我會(huì)指出其中的一些陷阱。

現(xiàn)在正是技術(shù)增長(zhǎng)的拐點(diǎn)期:作為個(gè)體而言,很難做出很有影響力的決策。我們?nèi)w選擇了一條道路,出于私有產(chǎn)權(quán)而束縛技術(shù)的發(fā)展,限制了它改變生活的可能性。

這篇文章最重要的基礎(chǔ)假設(shè)是:忽視所有權(quán),在不久的將來(lái)增強(qiáng)現(xiàn)實(shí)會(huì)無(wú)處不在,始終開(kāi)放,會(huì)如同現(xiàn)在的智能手機(jī)一樣被廣泛采用。從硬件的角度來(lái)說(shuō),這可能意味著增強(qiáng)眼鏡、隱形眼鏡、車?yán)锏膿躏L(fēng)玻璃、大腦植入、栓劑(suppositories)或者你有的東西。

如果你不是在這個(gè)前提下和我探討,那么下面的的內(nèi)容將對(duì)你沒(méi)什么幫助。也許有一天這兒會(huì)出現(xiàn)關(guān)于這個(gè)前提的討論,但對(duì)我來(lái)說(shuō)這個(gè)結(jié)論已經(jīng)不需要爭(zhēng)辯了。

在這個(gè)信仰之外,我也套用Nick Bostrom?的話:這篇文章里的許多假設(shè)可能是錯(cuò)誤的,但我不知道是哪一個(gè)。

與早期互聯(lián)網(wǎng)相比

對(duì)現(xiàn)在而言,增強(qiáng)現(xiàn)實(shí)無(wú)論是嵌入到可穿戴設(shè)備中,還是以“魔法鏡子”或手機(jī)窺視鏡的方式,它在部署和消費(fèi)方面都很像早期互聯(lián)網(wǎng)的布局。主要是,消費(fèi)級(jí)增強(qiáng)現(xiàn)實(shí)系統(tǒng)被設(shè)計(jì)為在一個(gè)時(shí)間內(nèi)只運(yùn)行一個(gè)程序,而那時(shí)候的互聯(lián)網(wǎng)應(yīng)用程序,也是在一個(gè)時(shí)間里只能連接一個(gè)系統(tǒng)或數(shù)據(jù)模型。

相對(duì)應(yīng)在內(nèi)容創(chuàng)作方面,創(chuàng)作者必須給每個(gè)應(yīng)用單獨(dú)創(chuàng)作內(nèi)容。如果我想給Layar AR?平臺(tái)創(chuàng)造內(nèi)容,我必須基于他們的用戶界面后端(這不是可擴(kuò)展的方法),然后根據(jù)這個(gè)目標(biāo)提供一個(gè)版本。如果我想對(duì)Aurasma、Wikitude或BrowsAR?做同樣的事,或者做其他的標(biāo)記來(lái)追蹤,我需要重新給每個(gè)平臺(tái)設(shè)計(jì)。

互聯(lián)網(wǎng)的早期應(yīng)用,在某種程度而言有非常多的限制。上個(gè)世紀(jì)90?年代,如果你想傳輸文件給一個(gè)用戶,你得先打電話給他,讓他們準(zhǔn)備好,啟動(dòng)和收件相關(guān)的程序,通過(guò)撥號(hào)連接聯(lián)系到對(duì)方,然后傳輸文件。而如果我想和他們聊天,我需要斷開(kāi)連接,打電話給他們讓他們啟動(dòng)聊天應(yīng)用程序,關(guān)閉收發(fā)程序,然后才可以聊天。

早期互聯(lián)網(wǎng)的部分力量,在于它使得任意的內(nèi)容可以在任何地方進(jìn)行演示。這個(gè)能力從HTML?開(kāi)始,TimBerners-Lee?采用了已被接受的標(biāo)準(zhǔn)SGML。不久后瀏覽器誕生了,從1992?年基于文本的瀏覽器Lynx?的到來(lái)開(kāi)始。

正是這種內(nèi)容和表現(xiàn)形式的分離,才有可能創(chuàng)造現(xiàn)在被稱為互聯(lián)網(wǎng)的生態(tài)系統(tǒng)。也正是在這樣的背景下,創(chuàng)新的推動(dòng)和標(biāo)準(zhǔn)化的發(fā)生,才帶給我們現(xiàn)在的瀏覽器:可以同時(shí)運(yùn)行多種程序,有功能齊全的應(yīng)用以及獨(dú)立于瀏覽器的設(shè)計(jì)。

這并不是說(shuō),人們致力于圍繞互聯(lián)網(wǎng)各大平臺(tái)做專門(mén)化的設(shè)計(jì)是沒(méi)有價(jià)值的。必須強(qiáng)調(diào)的是,現(xiàn)在的情況有些跳躍,超越對(duì)當(dāng)前創(chuàng)造物和增強(qiáng)現(xiàn)實(shí)內(nèi)容的思考?,F(xiàn)在是一場(chǎng)競(jìng)賽,去定義最具有實(shí)力的平臺(tái),并希望它能夠成為事實(shí)上的標(biāo)準(zhǔn)。通過(guò)這樣做,這些早期進(jìn)入者希望能圍繞封閉系統(tǒng),定義自己的市場(chǎng)。

但問(wèn)題顯然更大

這些問(wèn)題可以被解決,通過(guò)對(duì)網(wǎng)頁(yè)和3D?圖形標(biāo)準(zhǔn)化,建立靈活的標(biāo)記語(yǔ)言,給AR?瀏覽器開(kāi)放SDK,并使之和內(nèi)容彼此獨(dú)立。這將是尋求共識(shí)的挑戰(zhàn),但這不是在重新發(fā)明輪子,事實(shí)上他們已經(jīng)在這兒了。

廣泛采用一種標(biāo)記語(yǔ)言是可以想象的,而且很可能會(huì)出現(xiàn)一個(gè)或多個(gè)獨(dú)立于內(nèi)容的AR?瀏覽器(更重要的是,也獨(dú)立于硬件),這就像我們現(xiàn)在基于屏幕的互聯(lián)網(wǎng)內(nèi)容。

更大的問(wèn)題來(lái)自于真實(shí)增強(qiáng)現(xiàn)實(shí)應(yīng)用對(duì)內(nèi)容的感知能力。用戶在互聯(lián)網(wǎng)中的輸入,限制在鍵盤(pán)和鼠標(biāo),但AR?應(yīng)用被期待能夠?qū)ξ覀兊乃枷胱龀龇磻?yīng)。AR的硬件必須轉(zhuǎn)播AR?軟件的內(nèi)容,并且連接到系統(tǒng)里從各個(gè)傳感器的輸入:視覺(jué)輸入、音頻輸入、語(yǔ)音命令、地理信息等。

但這樣的系統(tǒng)會(huì)對(duì)信息流做什么事情?當(dāng)然,你可以想象一個(gè)應(yīng)用程序做一些和你的位置和方向相關(guān)的工作,并且在頭戴式設(shè)備中進(jìn)行地圖標(biāo)記,但我們現(xiàn)在就有了,而且這非常無(wú)聊。

在互聯(lián)網(wǎng)的情況下,搜索通過(guò)超鏈接,能夠?qū)ξ谋据斎朐L問(wèn)遠(yuǎn)程托管的內(nèi)容。以AR?作為等價(jià)的類比,但在“搜索”這個(gè)環(huán)節(jié)就失敗了。就結(jié)果而言,我們?cè)贏R?操作中并沒(méi)有鼠標(biāo),所有輸入到搜索里面的,是視覺(jué)和傳感器的數(shù)據(jù),而非小心輸入的文本信息。所以超鏈接往往不管用。

在最普遍的意義上,AR搜索是必須的,作為第一步,要把我們大腦所想的和信息做到一致。聽(tīng)起來(lái)很簡(jiǎn)單么?并不是這樣。

教機(jī)器以語(yǔ)義

要教會(huì)機(jī)器識(shí)別它看到的東西,這里面有一百萬(wàn)個(gè)難題。我不打算把它們一一列舉出來(lái),部分是因?yàn)槲也粔蛸Y格,另外也因?yàn)檫@篇文章并不是直接關(guān)于機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué)。

這是關(guān)于未來(lái)的重要難題。當(dāng)機(jī)器能夠識(shí)別出東西,或者一個(gè)具體的實(shí)例、地點(diǎn)和接近用戶的其他人,這都是AR?未來(lái)的問(wèn)題。

當(dāng)一個(gè)AR?系統(tǒng)解決了它看到的問(wèn)題,這就能夠給刺激帶來(lái)反應(yīng)鏈,導(dǎo)致系統(tǒng)實(shí)際上給你的周圍增加新的場(chǎng)景。例如,當(dāng)指向我的AR?隱形眼鏡的時(shí)候,它會(huì)采集一些顏色的信息,也許會(huì)有一些深度信息(3D),一些規(guī)模信息(上下文),地理信息,聲音、溫度、高度等,然后根據(jù)這些信息來(lái)識(shí)別出物體。

目前來(lái)說(shuō),小規(guī)模的作者驅(qū)動(dòng)的AR?系統(tǒng),需要內(nèi)容創(chuàng)造者在創(chuàng)造時(shí)輸入3D?模型和2D?文本。應(yīng)用程序在這個(gè)時(shí)候,會(huì)搜索輸入的視頻流,看這些物體的文本和數(shù)據(jù)庫(kù)中哪些物品能夠匹配上。而當(dāng)它能夠識(shí)別出一個(gè)的時(shí)候,就給出設(shè)計(jì)好的回應(yīng)。這些回應(yīng)是有限的,在大多數(shù)情況下,對(duì)視頻或3D?內(nèi)容在預(yù)先定義的空間關(guān)系上進(jìn)行疊加或者識(shí)別。

為了解當(dāng)前系統(tǒng)固有的問(wèn)題,增強(qiáng)現(xiàn)實(shí)反應(yīng)和輸入之間的對(duì)應(yīng)關(guān)系,取決于個(gè)人作者的決定。在這個(gè)封閉系統(tǒng)里,我們來(lái)看看關(guān)于這些的案例,里面有很多的利益相關(guān)者。

在我們的假設(shè)下,未來(lái)不依賴于內(nèi)容的AR?瀏覽器,會(huì)在各種各樣的硬件上運(yùn)行。當(dāng)我們看著一個(gè)可樂(lè)瓶的時(shí)候會(huì)發(fā)生什么?首先,這兒會(huì)有很大的光澤,而下面會(huì)更多,系統(tǒng)會(huì)像我們的大腦一樣,識(shí)別出這個(gè)罐子,并且說(shuō)道:“這兒有一件你的東西,屬于可樂(lè)罐的類別,甚至可能會(huì)有更多的信息,例如凹陷的、打開(kāi)的、生產(chǎn)于亞特蘭大,2017年11?月過(guò)期等。

更重要的是,這是一個(gè)象征性的識(shí)別,相比于現(xiàn)在的文本檢索,更抽象也更強(qiáng)大。

作為最近的例子,Google發(fā)布了Cloud Vision API,使用機(jī)器學(xué)習(xí)的方法進(jìn)行圖像識(shí)別。這很像Google Goggles?過(guò)去做的,給實(shí)際的圖像添加標(biāo)簽,給地圖添加坐標(biāo),進(jìn)行人臉識(shí)別和OCR。給這些識(shí)別進(jìn)行堆棧,并且配對(duì)置信分?jǐn)?shù),通過(guò)Rest API?得到反饋。通過(guò)這項(xiàng)服務(wù),開(kāi)發(fā)人員可以利用Google?的能力以確定內(nèi)容圖像。我們可以看到圖像識(shí)別的能力還會(huì)進(jìn)一步擴(kuò)大,隨著系統(tǒng)給更多的具體物品建立標(biāo)簽,甚至對(duì)世界的名字進(jìn)行鏈接的分類,例如把WordNet?和ImageNet?聯(lián)系起來(lái)。

不管執(zhí)行情況怎樣,我們做出一個(gè)關(guān)鍵的決策:下一步會(huì)發(fā)生什么?當(dāng)系統(tǒng)識(shí)別出可口可樂(lè)的存在后,會(huì)展現(xiàn)出什么?請(qǐng)記住,未來(lái)這些系統(tǒng)已經(jīng)得到普遍和廣泛的使用,難道不應(yīng)該發(fā)生些事情嗎?

增強(qiáng)現(xiàn)實(shí)的權(quán)力江湖

可口可樂(lè)的廣告,一下子就顯得有生命起來(lái)了??赡苁且欢蜛R?的效果展現(xiàn)在可樂(lè)瓶上面,或者一群美麗的家人,以3D?的形式聚集起來(lái),拿著自己的可樂(lè)瓶向你致敬?或者百事可樂(lè)的廣告在前面出現(xiàn),遮擋住可口可樂(lè)的品牌?

對(duì)我來(lái)說(shuō),可以運(yùn)行一個(gè)AR?廣告屏蔽的插件嗎?或者購(gòu)買服務(wù),以減少程序的贊助商內(nèi)容?當(dāng)我訪問(wèn)時(shí)代廣場(chǎng)并且抬頭看到三星的廣告牌,我能看到一個(gè)“真的”廣告牌嗎?

增強(qiáng)現(xiàn)實(shí)的權(quán)力江湖

那么,你周圍人的臉呢?你從屏幕上閱讀的文字?公寓里的墻壁?你都能得到圖片。

問(wèn)題的復(fù)雜性在于,一個(gè)彈出的畫(huà)面可能會(huì)不安全。假如說(shuō)我在駕駛公交車,那么這些事情的解釋就不是文字那么簡(jiǎn)單。這些復(fù)雜的因素會(huì)對(duì)我們的行為影響很大。

問(wèn)題在于我們擁有的語(yǔ)義學(xué)上,或者在更大的意義上說(shuō),網(wǎng)絡(luò)符號(hào)學(xué)。讓系統(tǒng)識(shí)別符號(hào)看起來(lái)有點(diǎn)瑣碎,相比于一些更復(fù)雜的問(wèn)題,例如涉及到環(huán)境中物體的意義,這背后還有知識(shí)產(chǎn)權(quán)的問(wèn)題。

而當(dāng)所有權(quán)和網(wǎng)絡(luò)空間的知識(shí)產(chǎn)權(quán)結(jié)合在一起,這里面的問(wèn)題就遠(yuǎn)多于其他方面。這會(huì)逐漸變得Ugly。

話語(yǔ)權(quán)的問(wèn)題

對(duì)于那些關(guān)注者來(lái)說(shuō),這個(gè)問(wèn)題可能聽(tīng)起來(lái)很熟悉。DNS的基礎(chǔ)是廣泛采用的協(xié)議,它由非政府組織ICANN?管理,這是總部設(shè)在美國(guó)的非盈利組織。它具有對(duì)URL?語(yǔ)義專屬的解釋權(quán),而且也對(duì)應(yīng)到互聯(lián)網(wǎng)協(xié)議的空間。它沒(méi)有什么排他性,這成為了互聯(lián)網(wǎng)的基礎(chǔ),創(chuàng)造了通用文本的白皮書(shū),由于它和現(xiàn)實(shí)情況關(guān)于商標(biāo)、產(chǎn)權(quán)等案例的相似性,互聯(lián)網(wǎng)協(xié)議能夠根據(jù)它解決問(wèn)題。

不過(guò)我不相信,這些涉及到商標(biāo)、知識(shí)產(chǎn)區(qū)和隱私糾紛的事會(huì)很容易擴(kuò)展到VR?的領(lǐng)域。

關(guān)于所有權(quán)的話語(yǔ)權(quán)問(wèn)題,正如很多東西一樣,背后都有一些共同的利益,通過(guò)主導(dǎo)和游說(shuō)律師,最終落在了私人手里。我不需要對(duì)此過(guò)多解釋,但這不是最好的結(jié)果。不過(guò)為了使可能性成為可能,系統(tǒng)需要設(shè)計(jì)為依賴于有話語(yǔ)權(quán)的中央權(quán)威,而背后有利潤(rùn)的動(dòng)機(jī)。

沒(méi)有發(fā)生和DNS?相似的事情,因?yàn)檫€沒(méi)有人意識(shí)到坐在ICANN?的位置上會(huì)帶來(lái)多少價(jià)值,直到已經(jīng)為時(shí)尚晚。這并不意味著這不會(huì)發(fā)生,有一個(gè)猜測(cè)是,微軟在生產(chǎn)AR?硬件的興趣上,其利潤(rùn)可能不局限于設(shè)備本身。這不是他們玩的游戲。他們和Magic Leap?希望擁有自己的傳輸管道,所有東西從生產(chǎn)到內(nèi)容到分發(fā),都通過(guò)這里進(jìn)行。你也可以對(duì)Google?最新的CV?服務(wù)做類似的假設(shè)。

這給我們帶來(lái)了技術(shù)背后的支撐,不依賴于文本、傳感器驅(qū)動(dòng)、上下文感知、總是運(yùn)行的消費(fèi)者端AR?系統(tǒng),這些問(wèn)題的解決是非常重要的,最早這么做的也許能獲得那個(gè)圣杯。

沒(méi)有鍵盤(pán)的操作系統(tǒng)

正如Google?演示的一樣,能夠運(yùn)行各種隨意代碼的瀏覽器,和操作系統(tǒng)的區(qū)別是不多的。就像一些操作系統(tǒng)需要使用Windows?管理來(lái)保證GUIs?運(yùn)行的不錯(cuò),我們的AR?系統(tǒng)也在確保內(nèi)容以一種好的方式來(lái)展現(xiàn),考慮到我們的喜好以及大腦傳感器的帶寬。

例如說(shuō),你對(duì)于邊開(kāi)車邊聽(tīng)紐約時(shí)報(bào)表示完全的舒適,甚至在你視野的角落上,有一個(gè)小的視頻聊天窗口也可以。但當(dāng)你在高速公路疾馳的時(shí)候,你完全不想要更多的東西。相反,當(dāng)你在家里的時(shí)候,你也許會(huì)愿意接受更為沉浸式的體驗(yàn),但你也不會(huì)希望窗口彈出:你的煤氣賬單該交了。

在一個(gè)用戶定義的背景下,這有點(diǎn)像今天智能手機(jī)里的權(quán)限(Permissions)。我們可以給特定的應(yīng)用程序訪問(wèn)我們的注意力的權(quán)限,而我們的屏幕也會(huì)在特定的情況下彈出提醒。這是一個(gè)開(kāi)始,尤其是一些瀏覽器自己能提供通知和權(quán)限設(shè)置,這也是通常操作系統(tǒng)的功能。

先不管輸出的問(wèn)題,操作系統(tǒng)的任務(wù)如何接收傳感器的輸入和上下文信息?別忘了我們沒(méi)有鍵盤(pán)和鼠標(biāo),我們都是通過(guò)自己對(duì)世界的感知,來(lái)驅(qū)動(dòng)這個(gè)系統(tǒng)。

兩種途徑

正如我們常年期望電影CGI?的智能能夠超越實(shí)時(shí)系統(tǒng)能提供的,它將持續(xù)超越用戶端系統(tǒng)的能力,以掌握視覺(jué)處理和任務(wù)搜索,以感知周圍的世界,滿足我們對(duì)速度、正確率和帶寬不斷增長(zhǎng)的期待。

這意味著我們的設(shè)備會(huì)部署在一個(gè)低延遲、高帶寬的連接上。他們會(huì)通過(guò)刺激和上下文的理解,對(duì)用戶的狀態(tài)、聯(lián)系人、歷史、喜好和習(xí)慣進(jìn)行反應(yīng),就像當(dāng)下設(shè)備和互聯(lián)網(wǎng)做的那樣。

由于這些限制,到目前為止,所有潛在的方法都是相同的。在返回結(jié)果的性質(zhì)上,可能會(huì)出現(xiàn)問(wèn)題,而問(wèn)題的核心在于所有權(quán)和利潤(rùn)的動(dòng)機(jī)。

在AR?生態(tài)系統(tǒng)里,識(shí)別服務(wù)是由一個(gè)非盈利或其他中立的實(shí)體組織提供,服務(wù)器會(huì)不斷吸收這些信息流,并且從提供的零散聯(lián)結(jié)刺激中進(jìn)行推斷。

這是一輛自行車。那是124鷹街。那是你的朋友Willy。那是西方。這是一輛卡車。那是街。這是石頭。這是一個(gè)交通燈,它是綠色的。

這些離散標(biāo)記的集合,會(huì)通過(guò)管道返回到硬件里,作為對(duì)世界的標(biāo)記,然后準(zhǔn)備好在用戶的應(yīng)用程序里得到解釋。

這意味著刺激的識(shí)別以及增強(qiáng)現(xiàn)實(shí)解釋,通過(guò)用戶端的代碼可以持續(xù)的作用,就像現(xiàn)在互聯(lián)網(wǎng)做的一樣。在一個(gè)物理分布式的網(wǎng)絡(luò)中,相同的組織會(huì)被某些廣泛聯(lián)系、同意授權(quán)的DNS?控制。關(guān)鍵是,這意味著識(shí)別和解釋的任務(wù),是被分離的。

當(dāng)然,這樣的處理能力會(huì)給供應(yīng)商帶來(lái)巨大的成本,無(wú)論是開(kāi)發(fā)還是經(jīng)營(yíng)費(fèi)用。因此,必須使得供應(yīng)商通過(guò)某些方式收回成本。在ICANN?的情況下,這項(xiàng)服務(wù)是通過(guò)非盈利組織來(lái)提供的,現(xiàn)在看起來(lái)運(yùn)行的還不錯(cuò)。它會(huì)象征性的收取注冊(cè)費(fèi)用,而最近它也拍賣了一些頂級(jí)域名。

我們正在討論的系統(tǒng)類型,并不會(huì)如此簡(jiǎn)單的發(fā)展或者根據(jù)DNS?的根域名服務(wù)器進(jìn)行維護(hù)。而正如上面討論的,現(xiàn)在還很難界定清楚,作為一個(gè)非盈利組織究竟什么可以出售。即便是擁有非常民主化的深度學(xué)習(xí)工具,GPU集群也不便宜,而帶寬也不是免費(fèi)。

我們可以很容易的想象到,識(shí)別服務(wù)會(huì)差不多由一小部分Google?規(guī)模的公司壟斷。這些提供識(shí)別服務(wù)的公司會(huì)尋求垂直的整合,密切和消費(fèi)者的硬件、軟件服務(wù)進(jìn)行聯(lián)系,就像我們現(xiàn)在看到的智能手機(jī)、游戲機(jī)和閱讀器等。

一旦循環(huán)被關(guān)閉,就很難阻止供應(yīng)商給最高價(jià)格的公司提供前所未有的用戶訪問(wèn)權(quán)。

這可能意味著任何數(shù)量的貨幣,優(yōu)先展現(xiàn)贊助商關(guān)于產(chǎn)品、地方和人的內(nèi)容,甚至是具體的文本,例如當(dāng)你看到車的引擎蓋的時(shí)候,會(huì)出來(lái)如何維護(hù)的手冊(cè),或者是零售產(chǎn)品的評(píng)論。想想一個(gè)有驚人經(jīng)濟(jì)實(shí)力的公司,它能夠完全控制始終開(kāi)啟的視覺(jué)系統(tǒng),嵌入到成千上萬(wàn)的消費(fèi)者的注意力中。至少,你現(xiàn)在還可以不看電視廣告。

想象一下,當(dāng)這些應(yīng)用處于追求利潤(rùn)的公司手上時(shí),或者在分布式的生態(tài)系統(tǒng)時(shí),會(huì)有什么不同。

以微軟為例,Harris確認(rèn)說(shuō),微軟對(duì)HoloLens?平臺(tái)的意圖,是通過(guò)服務(wù)器同步所有用戶的體驗(yàn)。這些多用戶的體驗(yàn)是一種共享幻覺(jué),這能帶來(lái)AR?的廣泛使用。

服務(wù)器端的應(yīng)用程序和預(yù)先渲染的內(nèi)容,將進(jìn)一步加強(qiáng)垂直整合,避免各地客戶端的反向工程或“越獄”,并把客戶端的硬件轉(zhuǎn)化為簡(jiǎn)單的啞巴終端,并把它變成免費(fèi)服務(wù)發(fā)放出去。

如果我們一起做

我們拒絕:國(guó)王、總統(tǒng)和投票。我們相信:共識(shí)和運(yùn)行的代碼。Tao of IETF

除了最堅(jiān)定的自由主義者,我們不得不承認(rèn)利潤(rùn)動(dòng)機(jī)和壟斷相結(jié)合,會(huì)導(dǎo)致非常不好的事情。

除了最左派的份子,我們也不得不承認(rèn),系統(tǒng)越現(xiàn)代和復(fù)雜,越不適應(yīng)政府提供的服務(wù)。近期這些自豪吹噓的政客們,也表現(xiàn)出對(duì)互聯(lián)網(wǎng)知識(shí)缺乏了解。

即便是像ICANN?這樣的非政府、非盈利組織來(lái)規(guī)范識(shí)別任務(wù),我們也會(huì)有微妙的形勢(shì),審查制度、文化規(guī)范、禁忌、地緣政治沖突、政府、警察,遠(yuǎn)遠(yuǎn)超過(guò)Google?在世界范圍內(nèi)遇到?jīng)]完沒(méi)了的挑戰(zhàn)。這是一個(gè)永無(wú)止境的戰(zhàn)斗,而且沒(méi)有更高的權(quán)威來(lái)仲裁糾紛。

有一種觀點(diǎn)認(rèn)為,識(shí)別問(wèn)題的規(guī)模表明,唯一可行的、可拓展的解決方法,將會(huì)依賴于用戶在輸入上的逐漸增多,類似于reCAPTCHA?中的分布式OCR?項(xiàng)目。而在深度學(xué)習(xí)技術(shù)出現(xiàn)之前,語(yǔ)音識(shí)別和計(jì)算機(jī)視覺(jué)的問(wèn)題都過(guò)于復(fù)雜,而難以操作。

這些早期的方法,試圖把復(fù)雜的識(shí)別問(wèn)題,分解為較小的不相關(guān)的任務(wù)。深度學(xué)習(xí),雖然更加自主,但還是需要大量正確標(biāo)記的數(shù)據(jù)集,這需要培養(yǎng)對(duì)真實(shí)世界的經(jīng)驗(yàn)。這意味著,人類需要先對(duì)此進(jìn)行標(biāo)記,這種工作也許超越了最財(cái)大氣粗的實(shí)體。

深度學(xué)習(xí)最近在各個(gè)領(lǐng)域的成功是一個(gè)提示,但是尋找合適的訓(xùn)練材料,依然是個(gè)障礙。

即便有一個(gè)合適的組織,訓(xùn)練一個(gè)識(shí)別系統(tǒng)能夠?qū)Ω鞣N任務(wù)進(jìn)行反應(yīng),數(shù)據(jù)中心也不便宜,而除了維基百科之外,我們還沒(méi)看到哪些大規(guī)模的自組織任務(wù)能夠在年輕網(wǎng)絡(luò)實(shí)行的案例。這不是找到誰(shuí)來(lái)買單的問(wèn)題,必須有人來(lái)駕駛這艘船只。

但是,假如我們從最近的假設(shè)中學(xué)習(xí)到了某些錯(cuò)誤,而你也同意我的觀點(diǎn),那么什么時(shí)候會(huì)開(kāi)始建立一個(gè)在互聯(lián)網(wǎng)協(xié)議層,結(jié)束被單一組織控制的的垂直實(shí)體?這個(gè)組織是什么樣子?

甚至可以想象,未來(lái)這個(gè)角色由一個(gè)營(yíng)利性公司來(lái)承擔(dān)?

或者說(shuō),一個(gè)分布式的組織,或者一個(gè)標(biāo)準(zhǔn)組織,一個(gè)政府實(shí)體,來(lái)扮演這個(gè)角色?

 

本文來(lái)自Medium,原作者Noah Norman,由王嘉俊原創(chuàng)翻譯。

原文地址:http://www.leiphone.com/news/201601/YQm0wC5gzUtmqllX.html

本文來(lái)源于人人都是產(chǎn)品經(jīng)理合作媒體@雷鋒網(wǎng)

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!