你見(jiàn)過(guò)的很多可能都是假的人工智能

劉飛
1 評(píng)論 10036 瀏覽 15 收藏 8 分鐘

這篇文章來(lái)自我在哈爾濱工業(yè)大學(xué)的學(xué)弟、機(jī)器學(xué)習(xí)從業(yè)者Jiasheng Tang。希望能跟大家科普一些關(guān)于人工智能創(chuàng)業(yè)的常識(shí)。

內(nèi)容起源于一次小范圍的對(duì)話:作為投資公司負(fù)責(zé)投資/調(diào)研人工智能相關(guān)企業(yè)/市場(chǎng)的人,如何判斷什么樣的企業(yè)值得投資?人工智能在當(dāng)下是很熱,無(wú)數(shù)的科技公司都會(huì)強(qiáng)調(diào)自己是一家基于智能的公司??谌魬液印凉唤^地談起我們使用了人工智能技術(shù)balabala……所以我想談?wù)勅绾卧谶@樣的對(duì)話甚至新聞稿中識(shí)別相關(guān)內(nèi)容的可靠性。

首先,眼下任何公司談?wù)撊斯ぶ悄艿幕A(chǔ)是大數(shù)據(jù) + 算法,先有大數(shù)據(jù)計(jì)算能力最重要

隨著存儲(chǔ)成本的逐步降低,對(duì)于很多公司來(lái)講,無(wú)論是采購(gòu)硬盤(pán)還是購(gòu)買(mǎi)云存儲(chǔ)服務(wù),獲取并保存海量數(shù)據(jù)并不是特別困難的一件事?,F(xiàn)在聲稱(chēng)做人工智能的公司,也一定會(huì)強(qiáng)調(diào)他們有大數(shù)據(jù)的積累。擁有大量數(shù)據(jù)在近些年已經(jīng)是一件開(kāi)始常態(tài)化的事情,真正的問(wèn)題是如何把數(shù)據(jù)用起來(lái)。那么基于這個(gè)假設(shè),就可以一步一步地追問(wèn)下去:

  1. 你們數(shù)據(jù)量到底有多大?每日產(chǎn)出多少個(gè)T的數(shù)據(jù)?線上都有會(huì)收集哪類(lèi)日志?
  2. 有幾個(gè)的集群去處理、最大的集群有多少臺(tái)機(jī)器?
  3. 上線之后,使得哪些業(yè)務(wù)有提升?
  4. 一個(gè)常規(guī)的流程(從數(shù)據(jù)采集到新模型上線)能做到t+幾?
  5. ?……

以上問(wèn)題大概就能了解這個(gè)公司在數(shù)據(jù)收集和數(shù)據(jù)計(jì)算上的能力,沒(méi)有相關(guān)處理能力的公司/團(tuán)隊(duì)可以在這一輪就再見(jiàn)了。

因?yàn)檫@個(gè)只是錢(qián)的問(wèn)題。

其次,建立在基礎(chǔ)的數(shù)據(jù)處理能力之上的,是算法

很多公司就到這一步開(kāi)始平庸(僅僅能對(duì)數(shù)據(jù)做簡(jiǎn)單的分析),這也給了大家一個(gè)印象:國(guó)內(nèi)的公司數(shù)據(jù)水平只停留在數(shù)據(jù)分析(甚至不如)。

如果說(shuō)計(jì)算能力還可以用錢(qián)堆到一個(gè)還不錯(cuò)的規(guī)模,那么算法能力,就完全要靠人。 深入地做數(shù)據(jù)分析以至于應(yīng)用相關(guān)的人工智能技術(shù)(或者幾乎可以替換地叫機(jī)器學(xué)習(xí)技術(shù)),是具備一定的門(mén)檻的。僅僅是以呈現(xiàn)報(bào)表、統(tǒng)計(jì)相關(guān)指標(biāo)更多的是一種業(yè)務(wù)能力的體現(xiàn)。針對(duì)于公司的算法能力,可以問(wèn)如下的問(wèn)題(還是遞進(jìn)順序):

  1. 如何根據(jù)分析的結(jié)果進(jìn)行建模?
  2. 如何使用算法去解決問(wèn)題?(這個(gè)問(wèn)題有點(diǎn)太專(zhuān)業(yè)了…
  3. 有能力在線上服務(wù)中使用非常復(fù)雜的算法么?(線上服務(wù)中能夠使用多復(fù)雜的算法?)
  4. ……

對(duì)于在這一步開(kāi)始扯人工智能、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等術(shù)語(yǔ)試圖“群魔亂舞”的時(shí)候,首先,保持警惕,堅(jiān)持問(wèn)出以上幾個(gè)問(wèn)題;更進(jìn)一步,如果有開(kāi)始大談奇點(diǎn)論的問(wèn)題的話,那就可以轉(zhuǎn)身走人了。

還有一點(diǎn)是屬于業(yè)務(wù)層面的事情:是否有使用機(jī)器學(xué)習(xí)算法的必要性。對(duì)于創(chuàng)業(yè)公司,這一點(diǎn)要格外注意。大公司往往有這個(gè)能力甚至閑心讓人工智能處處使用AI everywhere)。然而對(duì)于創(chuàng)業(yè)公司,衡量人力物力投入、產(chǎn)出、開(kāi)發(fā)周期、效果、甚至業(yè)務(wù)底線是很關(guān)鍵的。如果一家仍在創(chuàng)業(yè)期的公司開(kāi)始考慮讓非必要業(yè)務(wù)強(qiáng)行使用機(jī)器學(xué)習(xí),是很危險(xiǎn)的信號(hào);機(jī)器學(xué)習(xí)應(yīng)用在創(chuàng)業(yè)公司的第一目的應(yīng)該是:讓主業(yè)務(wù)(比如對(duì)投資人負(fù)責(zé)的業(yè)務(wù))保持增長(zhǎng)。

所以我一直持有一個(gè)觀點(diǎn):排除廣告、圖像、語(yǔ)音類(lèi)業(yè)務(wù)之外,只有相對(duì)成熟的公司才具備條件(包括充足的人力、良好的數(shù)據(jù)積累、計(jì)算能力、業(yè)務(wù)規(guī)模足夠等)盤(pán)點(diǎn)自己的各項(xiàng)業(yè)務(wù),尋找依靠算法的可行提升點(diǎn)。人工智能應(yīng)該是規(guī)劃,不是追求熱點(diǎn)。

最后,算法之上的,是優(yōu)化

這個(gè)有點(diǎn)涉及到問(wèn)題的本質(zhì):我們?yōu)槭裁凑勅魏喂径家獡肀А⒒蛘哒f(shuō)規(guī)劃智能?其實(shí)這還真的不全是因?yàn)橐鲇疲ㄐ?/p>

所謂擁抱智能其實(shí)歸根結(jié)底是一個(gè)更好的解決方案:用一類(lèi)技術(shù)為公司提供無(wú)數(shù)種可能性。我們看到滴滴做智能派單、智能路徑規(guī)劃;看到阿里做個(gè)性化推薦;看到DeepMind曾經(jīng)為谷歌數(shù)據(jù)中心省了數(shù)億美元…這類(lèi)技術(shù)更本質(zhì)上講,都是優(yōu)化技術(shù)的具體呈現(xiàn),它包括:

  1. 常見(jiàn)機(jī)器學(xué)習(xí)算法的立足點(diǎn)凸優(yōu)化/非凸優(yōu)化(深度學(xué)習(xí)完全是非凸優(yōu)化)
  2. 經(jīng)濟(jì)學(xué)領(lǐng)域活躍的博弈論
  3. 管理科學(xué)中的運(yùn)籌學(xué)
  4. 組合優(yōu)化(很多參加過(guò)計(jì)算機(jī)競(jìng)賽選手的最?lèi)?ài)之一)、在線優(yōu)化等……

優(yōu)化,在以前曾經(jīng)是很多行業(yè)高端的BI;人工智能,在這一次的浪潮里面,其實(shí)是新瓶裝了優(yōu)化這個(gè)醇香的酒。

怎樣讓自己開(kāi)始具備一定專(zhuān)業(yè)的判斷力?

首先,這應(yīng)該是一種能夠透過(guò)交流、PR稿、媒體報(bào)道等內(nèi)容,看到背后虛實(shí)的判斷力。而不是泛泛而談的人工智能概念與倫理問(wèn)題、奇點(diǎn)臨近等。

因?yàn)樵谶@里不想涉及到過(guò)多深入的領(lǐng)域知識(shí),考慮到相關(guān)人工智能必要性的背景知識(shí),推薦大家可以看一本書(shū)–吳軍博士的《數(shù)學(xué)之美》(定位在了解+一點(diǎn)的專(zhuān)業(yè)性)。哪怕這些年的更新更復(fù)雜的技術(shù),本質(zhì)也沒(méi)有脫離“數(shù)學(xué)”問(wèn)題的范疇。 (《智能時(shí)代》我本人并沒(méi)有看過(guò),不過(guò)也有人推薦)

當(dāng)下(2017年初)很靠譜的細(xì)分方向

智能相關(guān),兩個(gè)角度來(lái)判定到底是不是靠譜(這個(gè)靠譜的閾值有點(diǎn)高)地在做事:

  • 對(duì)于人工智能,如果一個(gè)團(tuán)隊(duì)或者公司強(qiáng)調(diào)他們是做優(yōu)化的,那十有八九是靠譜的——這是看待所做事情的角度;
  • 對(duì)于智能硬件,如果一個(gè)創(chuàng)業(yè)團(tuán)隊(duì)或者公司強(qiáng)調(diào)他們是做gpu、FPGA、手機(jī)等硬件/端的解決方案(并且有真實(shí)的demo),也是靠譜的——涉及到計(jì)算能力的未來(lái)發(fā)展。

最后,希望這篇文章能夠給想具備產(chǎn)業(yè)判斷能力的人提供一個(gè)視角。

 

作者:Jiasheng Tang

來(lái)源:微信公眾號(hào)【劉言飛語(yǔ)】

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 不錯(cuò)

    回復(fù)
专题
13481人已学习11篇文章
产品经理/运营/数据分析师,如果能够掌握一些常用的Excel的技巧,会对工作效率有所提高。本专题的文章分享了经常用到的Excel技巧。
专题
142256人已学习32篇文章
做一个好运营,技术和意识都得过硬。
专题
11584人已学习12篇文章
任何理论都有它的局限性和前提条件,没有一种方法论是永远有效的。品牌方法论一直处在变化阶段,它随着时代发展的变化而变化。本专题的文章分享了品牌方法论。
专题
11285人已学习12篇文章
从二维到三维空间的过渡,其交互范式也会随之从2D GUI时代转换到3D UI时代。本专题的文章分享了XR空间交互指南。
专题
35055人已学习22篇文章
从动效设计原则、动效工具、制作方法、标注技巧等全方位解读
专题
13540人已学习15篇文章
深度学习(Deep learning)是一种机器学习的分支,它是通过构建多层神经网络来实现自主学习和预测的能力。本专题的文章分享了解读深度学习。