產(chǎn)品如何做到差異化?試試個(gè)性化推薦和數(shù)據(jù)挖掘
本文寫(xiě)給想了解AI如何助力推薦系統(tǒng)的朋友,并對(duì)一些常見(jiàn)的推薦方式進(jìn)行梳理。
我們以往都強(qiáng)調(diào)需求,隨著過(guò)往移動(dòng)互聯(lián)網(wǎng)時(shí)代已經(jīng)極大豐富了各種需求,您還能找到哪種大的需求場(chǎng)景沒(méi)被滿足的嗎?幾乎沒(méi)有這樣的需求空白機(jī)會(huì)。
所以新年里產(chǎn)品唯一的機(jī)會(huì)點(diǎn)是做到跟競(jìng)品有差異化,怎么能做到差異化呢?即要比競(jìng)品更懂用戶,給用戶更精準(zhǔn)的推薦,就是挖掘數(shù)據(jù)應(yīng)用數(shù)據(jù)來(lái)推薦。
本文寫(xiě)給想了解AI如何助力推薦系統(tǒng)的朋友,并對(duì)一些常見(jiàn)的推薦方式進(jìn)行梳理。
4種主流的推薦方式
市場(chǎng)迄今為止,對(duì)推薦系統(tǒng)的分類并沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),但根據(jù)對(duì)淘寶產(chǎn)品的了解其推薦方法基本包括如下幾種:基于內(nèi)容的推薦方式、協(xié)同過(guò)濾的方式、基于知識(shí)推薦、組合推薦。
下面對(duì)4種推薦方式進(jìn)行介紹。
第一種:基于內(nèi)容的推薦方式
基于內(nèi)容的推薦(Content-Based Recommendation)系統(tǒng)是建立在用戶以前的行為模式基礎(chǔ)上的。以前的行為就是標(biāo)簽值,推薦算法將產(chǎn)品分解為一系列標(biāo)簽,并根據(jù)用戶對(duì)產(chǎn)品的行為(例如:購(gòu)買、瀏覽)將用戶屬性也描述為一系列標(biāo)簽。
如下圖:
該方式下的推薦系統(tǒng)為用戶提供包括用戶記錄中顯示偏好的一些信息,產(chǎn)品推薦并不是將用戶本身的喜好作為基礎(chǔ),而是以產(chǎn)品本身的信息作為基礎(chǔ)的。比如說(shuō):如果一個(gè)用戶對(duì)智能音箱比較感興趣,過(guò)去常常搜索和智能音箱相關(guān)的信息,那么該自動(dòng)推薦系統(tǒng)會(huì)將與智能音箱相關(guān)的其他音箱直接推薦給他。
用戶的偏好通常作為一組文本標(biāo)簽,用于表示用戶喜好類型的個(gè)人資料。
淘寶搜索框就是一種應(yīng)用于表現(xiàn)和研究用戶喜好的技術(shù)。這種方法可以將未分級(jí)的產(chǎn)品優(yōu)先推薦給具有獨(dú)特興趣的用戶。并且以列表的功能將推薦的商品展現(xiàn)出來(lái),還會(huì)對(duì)推薦的結(jié)果進(jìn)行解釋,這樣會(huì)無(wú)形中增加用戶對(duì)系統(tǒng)推薦商品的信心。
第二種:協(xié)同過(guò)濾的推薦方式
協(xié)同過(guò)濾推薦(Collaborative Filtering Recommendation)系統(tǒng)是根據(jù)其他用戶的選擇然后將一個(gè)商品推薦給用戶。但是商品的內(nèi)容不會(huì)被考慮到,也就是說(shuō),該方式下通過(guò)人對(duì)那個(gè)商品的判斷來(lái)進(jìn)行過(guò)濾。
對(duì)協(xié)同過(guò)濾最直白的說(shuō)法是就是用戶不知道怎么選擇,大家來(lái)幫他選擇。
協(xié)同過(guò)濾對(duì)應(yīng)的算法分類是基于用戶的協(xié)同過(guò)濾算法和基于物品的協(xié)同過(guò)濾算法,基于用戶的協(xié)同過(guò)濾算法的關(guān)鍵是找到相同偏好的用戶。
第三種:基于知識(shí)的推薦方式
基于知識(shí)的推薦方式(Knowledge-Based ?Recommendation)可以被看做是一種推理(inference)技術(shù)。
它并不是建立在用戶偏好和需要的基礎(chǔ)上進(jìn)行的推薦,而是通過(guò)對(duì)特定領(lǐng)域定義規(guī)則的基礎(chǔ)上來(lái)進(jìn)行基于規(guī)則以及實(shí)例的推理(case-based reasoning)。
例如:通過(guò)對(duì)飯店的菜品方式的效用知識(shí)的推理,將飯店推薦給顧客。我們將某個(gè)對(duì)象如何去滿足某一特定用戶的知識(shí)稱為效用知識(shí)(function knowledge),所以它能夠解釋推薦和需求的關(guān)系,可以被用于推薦系統(tǒng)。效用知識(shí)必須以機(jī)器可讀的方式存在(ontology ?本體知識(shí)庫(kù))于推薦系統(tǒng)中。
基于知識(shí)的推薦模型如下圖:
第四種:組合推薦的方式
組合推薦(Hybrid Recommendation)有一個(gè)重要原則,即它要求通過(guò)組合后能彌補(bǔ)和避免各種推薦技術(shù)所存在的缺點(diǎn)。
目前應(yīng)用最多的是協(xié)同過(guò)濾推薦和內(nèi)容推薦的組合,一般,盡管推薦組合的方法有很多種,然而不同的應(yīng)用場(chǎng)景需要不同的組合思路。
筆者根據(jù)淘寶的經(jīng)驗(yàn)具體的對(duì)產(chǎn)品運(yùn)營(yíng)或者算法人員給出的組合思路大致的可以分為如下 3 類:
- 后融合:將大于等于兩種以上的推薦系統(tǒng)各自所產(chǎn)生的推薦結(jié)果進(jìn)行融合。比如:通過(guò)使用基于協(xié)同過(guò)濾的方法以及內(nèi)容的方法而得到推薦列表,對(duì)列表的結(jié)果進(jìn)行融合從而決定最后所推薦的對(duì)象。
- 中融合:將一種推薦方法作為框架,并融合另外的一種推薦方法。比如將協(xié)同過(guò)濾的方法作為框架,融合基于內(nèi)容的方法;或者將基于內(nèi)容的方法作為框架,融合協(xié)同過(guò)濾的方法。
- 前融合:直接對(duì)各種推薦方法進(jìn)行融合,如將基于協(xié)同過(guò)濾和基于內(nèi)容的方法整合到一個(gè)統(tǒng)一的框架模型下。
今天,新的年度里,寫(xiě)滿了「數(shù)據(jù)」的字樣。單純流量的價(jià)值開(kāi)始褪色,化作更加不言自明的基礎(chǔ)設(shè)施,而如何發(fā)掘數(shù)據(jù)價(jià)值、增強(qiáng)數(shù)據(jù)應(yīng)用,則成為了產(chǎn)品運(yùn)營(yíng)的主色調(diào)——這也成為了產(chǎn)品運(yùn)營(yíng)人員要想當(dāng)團(tuán)隊(duì)的領(lǐng)導(dǎo)角色必須懂?dāng)?shù)據(jù)挖掘的一般知識(shí)流程。
另外比競(jìng)爭(zhēng)對(duì)手更懂用戶需要數(shù)據(jù)挖掘,在做推薦系統(tǒng)之前,也需要數(shù)據(jù)挖掘,下面我們介紹數(shù)據(jù)挖掘方面產(chǎn)品運(yùn)營(yíng)應(yīng)該懂的點(diǎn)。
數(shù)據(jù)挖掘的過(guò)程是AI應(yīng)用的過(guò)程。因?yàn)閿?shù)據(jù)挖掘的過(guò)程是知識(shí)發(fā)現(xiàn)的過(guò)程,而知識(shí)發(fā)現(xiàn)是人工智能的一種典型應(yīng)用。
數(shù)據(jù)挖掘的方法:
數(shù)據(jù)挖掘的方法也就是從數(shù)據(jù)庫(kù)或其他數(shù)額特別巨大的海量信息儲(chǔ)存中提取出用戶感興趣的文本標(biāo)簽。
產(chǎn)品運(yùn)營(yíng)人員不妨偶爾從技術(shù)角度方面來(lái)看一下數(shù)據(jù)挖掘,因?yàn)樗Y(jié)合了采集數(shù)據(jù)和登記分類數(shù)據(jù),接著,類規(guī)則的知識(shí)將從大量數(shù)據(jù)中被生成。
數(shù)據(jù)挖掘領(lǐng)域包括許多技術(shù),如:機(jī)器學(xué)習(xí)、統(tǒng)計(jì)、模式識(shí)別、模型庫(kù)、數(shù)據(jù)庫(kù)、可視化等技術(shù)。產(chǎn)品運(yùn)營(yíng)懂這些技術(shù)的話一方面能夠從更多角度設(shè)計(jì)出差異化競(jìng)品的產(chǎn)品方案,另外一方面能夠更方便的跟算法、代碼、模型、數(shù)據(jù)倉(cāng)庫(kù)工程師等技術(shù)人員進(jìn)行交流。
通常情況下,數(shù)據(jù)挖掘的步驟如下圖所示:
產(chǎn)品運(yùn)營(yíng)人員從知道數(shù)據(jù)挖掘的步驟流程以后,您在跟進(jìn)產(chǎn)品進(jìn)度和實(shí)現(xiàn)數(shù)據(jù)提供的業(yè)務(wù)支撐上能夠做到更加有信心使產(chǎn)品差異化競(jìng)品!
上面講了數(shù)據(jù)挖掘的步驟,那么我們?cè)趶臄?shù)據(jù)庫(kù)特點(diǎn)的角度出發(fā),幫我們的產(chǎn)品運(yùn)營(yíng)人員介紹 8 個(gè)需要在數(shù)據(jù)挖掘過(guò)程中完成的任務(wù)。
任務(wù)一:產(chǎn)品運(yùn)營(yíng)定義好分類(Classification)
分類是最常見(jiàn)的數(shù)據(jù)挖掘任務(wù)。
這個(gè)任務(wù)由兩部分組成:
- 第一部分是研究新近對(duì)象的特點(diǎn);
- 第二部分是,將它分配給一組預(yù)定義的類。
與此同時(shí),分類有兩個(gè)主要的特點(diǎn):
- 特點(diǎn)一要求,要有一個(gè)定義明確的類;
- 特點(diǎn)二是,要有一個(gè)包括分類例子的訓(xùn)練集。
另外,還要構(gòu)建某種模型,用于將未分類的數(shù)據(jù)進(jìn)行分類。
第一步先將那些已經(jīng)分好類的訓(xùn)練集從數(shù)據(jù)中選出來(lái),然后在該訓(xùn)練集上建立分類模型,該模型的建立需要運(yùn)用數(shù)據(jù)挖掘分類的技術(shù),對(duì)那些還未進(jìn)行分類的數(shù)據(jù)進(jìn)行分類。
例如:
- ?通常將信用卡申請(qǐng)者,分類為高、中、低風(fēng)險(xiǎn),
- ?然后用戶會(huì)被分配到預(yù)先定義好的用戶分片中。
注意:類的個(gè)數(shù)是預(yù)先定義好的并且是確定的。
任務(wù)二:出估值(Estimation)
估值是一種用來(lái)處理具有連續(xù)性預(yù)估結(jié)果的任務(wù)。 采用估值的目的是,基于一些輸入的數(shù)據(jù),為一些連續(xù)的、未知的變量,提供一個(gè)值。比如收入、信用卡節(jié)余、身高等等。
估值和分類比較接近,所不同的是,分類是對(duì)離散型變量的輸出的描述,但是估值卻用于對(duì)連續(xù)值的輸出的處理;分類的類別數(shù)目是確定的,估值的量是不確定的。
比如:
- ?通過(guò)購(gòu)買行為,來(lái)評(píng)估一個(gè)家庭有多少個(gè)孩子;
- ?通過(guò)購(gòu)買行為,來(lái)評(píng)估一個(gè)家庭的收入有多少;
- ?估計(jì) real estate 的價(jià)值。
任務(wù)三:給出預(yù)測(cè)(Prediction)
通常情況下,預(yù)測(cè)是通過(guò)估值或分類起作用的,即通過(guò)估值或分類得出模型,然后該模型將被應(yīng)用于對(duì)未知變量來(lái)進(jìn)行預(yù)測(cè)。
預(yù)測(cè)的目的是對(duì)未來(lái)未知變量進(jìn)行預(yù)測(cè),然而這種預(yù)測(cè)必須通過(guò)時(shí)間來(lái)進(jìn)行驗(yàn)證,也就是說(shuō)必須等待一定的時(shí)間后,才能夠得出預(yù)測(cè)的準(zhǔn)確性是多少。
任務(wù)四:相關(guān)性分組或關(guān)聯(lián)分析(Affinity grouping or association rules)
關(guān)聯(lián)的任務(wù)是用來(lái)確定哪些產(chǎn)品應(yīng)該一起處理或者哪些事情將一起發(fā)生。
例如:假設(shè)某客戶在逛盒馬鮮生時(shí),當(dāng)該客戶在購(gòu)買澳龍時(shí),與此同時(shí)也會(huì)購(gòu)買多寶魚(yú),即 A => B(關(guān)聯(lián)規(guī)則)。
除此之外,我們產(chǎn)品運(yùn)營(yíng)人員應(yīng)該懂,它對(duì)產(chǎn)品運(yùn)營(yíng)還有更深的用途,它可以應(yīng)用于鑒別交叉銷售機(jī)會(huì)和設(shè)計(jì)有吸引力的產(chǎn)品和服務(wù)的包裝或組合。 例如:下次可以計(jì)算出澳龍與波士頓龍蝦的文本相似度,然后當(dāng)波士頓龍蝦庫(kù)存較多時(shí)可以組合波士頓龍蝦與多寶魚(yú)組合起來(lái)賣。
任務(wù)五:序列模式(Sequential pattern)
序列化模式檢測(cè)事務(wù)之間的模式,在事務(wù)數(shù)據(jù)庫(kù)中,一段時(shí)間內(nèi)一組項(xiàng)目是跟在另一組項(xiàng)目的后面而存在的。
例如逛盒馬鮮生的時(shí)候,用戶在購(gòu)買澳龍后,隔一段時(shí)間,會(huì)購(gòu)買牛排。這有點(diǎn)類似于關(guān)聯(lián),但是,主要的不同點(diǎn)是序列模式展現(xiàn)出了不同產(chǎn)品之間在特定時(shí)間段內(nèi)的重要關(guān)系, 知道序列模式后的產(chǎn)品運(yùn)營(yíng)可以合理安排供應(yīng)鏈資源。
任務(wù)六:聚類(Clustering)
聚類可以對(duì)一個(gè)多樣化的群體進(jìn)行分割,從而形成一些更具有相似性的群體。
聚集通過(guò)對(duì)記錄進(jìn)行分組,從而將那些相似的記錄分割在一個(gè)聚集里。這些記錄之所以能夠被組織在一起,是因?yàn)樗麄儽旧砭痛嬖谀撤N相似性。聚集同分類的不同點(diǎn)是聚集不會(huì)對(duì)預(yù)先定義好的類進(jìn)行依賴,同時(shí)也不需要訓(xùn)練集。
任務(wù)七:優(yōu)化(Optimization)
優(yōu)化指的是優(yōu)化APP展現(xiàn)的設(shè)計(jì)和在線銷售的設(shè)計(jì)。
一般來(lái)說(shuō),這需要花很多的時(shí)間來(lái)考慮最優(yōu)的解決方案。遺傳算法(GA)常常是用于處理優(yōu)化技術(shù)的,如用于尋找解決方案的遺傳選擇、交叉和變異的優(yōu)化技術(shù)。例如:遺傳算法可以為APP的頁(yè)面創(chuàng)建數(shù)以千種的設(shè)置和組合。
任務(wù)八:描述和可視化(Description and Visualization)
是對(duì)數(shù)據(jù)挖掘結(jié)果的表示方式。
數(shù)據(jù)挖掘的目的之一是支撐業(yè)務(wù)發(fā)展。另外可視化技術(shù)可以將隱藏在表格或文本中的聚類和聯(lián)系直觀且迅速地展示在人們面前。
數(shù)據(jù)挖掘可以用來(lái)描述一個(gè)廣泛的運(yùn)營(yíng)活動(dòng)。
例如:一家4S銷售公司可以利用這項(xiàng)技術(shù),來(lái)挖掘用戶反饋的歷史數(shù)據(jù),建立許多預(yù)測(cè)模型,并做出相應(yīng)的對(duì)策,比如:用一條短信,或者打一個(gè)電話,來(lái)對(duì)客戶進(jìn)行游說(shuō)。
時(shí)下常常能看到「后移動(dòng)互聯(lián)網(wǎng)」、「未來(lái)十年最好的一年」等聳人聽(tīng)聞?dòng)帜@鈨煽傻脑捳Z(yǔ),告別了流量就是一切的時(shí)代,我們產(chǎn)品運(yùn)營(yíng)對(duì)于數(shù)據(jù)為基礎(chǔ),AI算法為突破的學(xué)習(xí)與思考從未像今天這樣急需和尖銳。
由于移動(dòng)互聯(lián)網(wǎng)的普及和個(gè)性化的社會(huì)趨勢(shì),數(shù)據(jù)挖掘技術(shù)將會(huì)被普遍用來(lái)分析用戶購(gòu)買的產(chǎn)品服務(wù)的行為。這是為了找出用戶的偏好,并為用戶提供相關(guān)產(chǎn)品信息,以增加銷售額和銷售價(jià)格。
那么先知道數(shù)據(jù)挖掘流程先挖掘出來(lái)用戶的喜好的產(chǎn)品運(yùn)營(yíng)團(tuán)隊(duì)再配合推薦算法,這樣就可以在產(chǎn)品運(yùn)營(yíng)上領(lǐng)先競(jìng)品一步。
如果你想系統(tǒng)化入門AI產(chǎn)品經(jīng)理,掌握AI產(chǎn)品經(jīng)理的落地工作方法,戳這里>http://996.pm/7bjab
#專欄作家#
連詩(shī)路,公眾號(hào):LineLian。人人都是產(chǎn)品經(jīng)理專欄作家,《產(chǎn)品進(jìn)化論:AI+時(shí)代產(chǎn)品經(jīng)理的思維方法》一書(shū)作者,前阿里產(chǎn)品專家,希望與創(chuàng)業(yè)者多多交流。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議
把數(shù)據(jù)做好去挖掘客戶需求
數(shù)據(jù)挖掘工程師的重要性