業(yè)務(wù)模型 VS 算法模型,到底該怎么用?
在數(shù)據(jù)分析領(lǐng)域,我們經(jīng)常會(huì)遇到各種模型,從經(jīng)典的4P營銷理論到復(fù)雜的機(jī)器學(xué)習(xí)算法。這些模型在形式和應(yīng)用上各有不同,但它們的共同目標(biāo)是幫助我們更好地理解和解決問題。本文將深入探討業(yè)務(wù)模型和算法模型的區(qū)別,以及它們?cè)趯?shí)際工作中的應(yīng)用和優(yōu)勢(shì),幫助讀者在面對(duì)不同問題時(shí)選擇合適的模型工具。
提到數(shù)據(jù),就必須提到各種模型。小伙伴們經(jīng)常有疑惑:從4P、SWOT、RFM到線性回歸、決策數(shù)、Kmean聚類,都有人管它們叫模型,那這些模型到底有啥區(qū)別?今天一文講清,大家看完再也不迷路哦。
一、一個(gè)例子,看懂二者區(qū)別
模型一詞,本身指的是“對(duì)現(xiàn)實(shí)世界的抽象”,通過少數(shù)關(guān)鍵信息,描述復(fù)雜的問題。
提煉關(guān)鍵信息的方式有2種:如果從業(yè)務(wù)角度做提煉,就是:業(yè)務(wù)模型;如果用數(shù)學(xué)、統(tǒng)計(jì)學(xué)、運(yùn)籌學(xué)、機(jī)器學(xué)習(xí)方法論提煉,就是:算法模型。
舉個(gè)簡單的例子,我們常說“營銷4P模型”,這個(gè)4P其實(shí)是從業(yè)務(wù)邏輯出發(fā)的。站在業(yè)務(wù)視角,只要我做好了商品、渠道、價(jià)格、促銷,就能把貨賣出去。
但是落到數(shù)據(jù)層面,就有很大區(qū)別。商品和渠道屬性很難量化,我們只能通過打標(biāo)簽的方式,粗略對(duì)比不同標(biāo)簽下銷售指標(biāo)差異(如下圖):
商品價(jià)格/促銷與銷量的關(guān)系,容易用數(shù)據(jù)量化,因此催生出一個(gè)經(jīng)典的算法模型:價(jià)格彈性模型。首先采集不同價(jià)格下商品銷量;第二步,擬合函數(shù),總結(jié)出量價(jià)模型;第三步就可以拿模型推測(cè)漲價(jià)效果,或者求出利潤最大化的價(jià)格了(如下圖):
注意!方法都是為解決問題而設(shè)計(jì)的,兩種方法各有優(yōu)勢(shì)。
二、業(yè)務(wù)模型的優(yōu)勢(shì)
業(yè)務(wù)模型最大的優(yōu)勢(shì),在于能從業(yè)務(wù)角度給出問題的解釋。
比如:
- 是不是我的策略不對(duì)?
- 是不是我的選品不行?
- 是不是我的執(zhí)行力不行?
類似“策略”、“選品”、“執(zhí)行力”這些業(yè)務(wù)上思考 ,很難直接用x、y的加減乘除關(guān)系來衡量。此時(shí)就得構(gòu)造業(yè)務(wù)分析模型,先把“策略”、“選品”等名詞量化,再用邏輯樹的方法,對(duì)問題進(jìn)行拆分,構(gòu)造一個(gè)層層深入的分析邏輯,用排除法找到正確答案(如下圖)。
業(yè)務(wù)模型的第二個(gè)優(yōu)勢(shì),在于容易觀察業(yè)務(wù)行動(dòng)的效果。
比如上圖中,基于邏輯樹,業(yè)務(wù)改進(jìn)了執(zhí)行動(dòng)作,增加了人力投入。我們可以直接觀察:邏輯樹頂端問題,是否變好了,從而判斷分析是否真的到位(如下圖)。
業(yè)務(wù)模型的第三個(gè)優(yōu)勢(shì),在于清晰業(yè)務(wù)主體責(zé)任。
比如都是做預(yù)測(cè),如果直接用回歸算法或者平滑算法給出一個(gè)結(jié)論,那么業(yè)務(wù)部門就沒法看到自己行為的效果,還會(huì)迷惑地問:“那我下周加班不加班,結(jié)果一樣嗎?”“如果我搞不掂A客戶,轉(zhuǎn)而做B客戶,是不是預(yù)測(cè)會(huì)不一樣?”(如下圖)
此時(shí)如果用業(yè)務(wù)模型來預(yù)測(cè),可以直接把整體指標(biāo)按部門拆開,讓各部門填寫自己預(yù)期情況。雖然具體參數(shù)可能需要拍腦袋得出來,但是每個(gè)部門能直接看到自己需做到什么水平,從而反向激勵(lì)業(yè)務(wù)必須行動(dòng)。即使沒有完成任務(wù),也能清楚看到“是誰沒完成”。從而更快速地思考對(duì)策。
三、算法模型的優(yōu)勢(shì)
算法模型最大的優(yōu)勢(shì),并不是比人聰明,而是運(yùn)算速度快+省事。比如經(jīng)典的互聯(lián)網(wǎng)推廣問題,各種限制條件一堆:“推廣總預(yù)算,每個(gè)渠道轉(zhuǎn)化率,每個(gè)渠道可以預(yù)約檔期數(shù)量”等等。
此時(shí),如果用人力去安排,可能要計(jì)算半天,但熟悉運(yùn)籌學(xué)的同學(xué)們都知道,這是個(gè)典型的線性規(guī)劃模型,只要能寫清楚建模假設(shè),
就很容易出結(jié)果(如下圖)。
更方便的是,如果以后有調(diào)整,比如:
- 修改總投放費(fèi)用
- 渠道檔期數(shù)變化
- 渠道轉(zhuǎn)化率變化
那么只要修改模型參數(shù),就能快速出結(jié)果了,非常方便(如下圖):
算法模型的第二個(gè)優(yōu)勢(shì),是能發(fā)現(xiàn)業(yè)務(wù)沒注意到的情況。
比如做商品分析的時(shí)候,業(yè)務(wù)上是可以手動(dòng)輸出一份《商品關(guān)聯(lián)規(guī)則表》,但這個(gè)表格的規(guī)則是固定的。如果用關(guān)聯(lián)規(guī)則算法,則可以突破業(yè)務(wù)思路的限制,發(fā)現(xiàn)更多潛在關(guān)聯(lián)銷售邏輯。雖然不見得是“啤酒與尿布”這么夸張的東西,但是也對(duì)啟發(fā)業(yè)務(wù)思路很有幫助(如下圖)。
算法模型的第三個(gè)優(yōu)勢(shì),就是處理大規(guī)模數(shù)據(jù)了。
典型的業(yè)務(wù)模型RFM,做用戶分層時(shí),如果每個(gè)指標(biāo)分3類,那么就有3*3*3=27類,在業(yè)務(wù)上已經(jīng)復(fù)雜到很難匹配對(duì)應(yīng)策略了。但是如果用協(xié)同過濾算法,完全可以做到千人千面,這也是算法模型的巨大優(yōu)勢(shì)。
之所以互聯(lián)網(wǎng)公司傾向于用算法做推薦,主要是源自互聯(lián)網(wǎng)平臺(tái)上的商品量以十億計(jì),極難手動(dòng)匹配規(guī)則。
四、業(yè)務(wù)與算法,如何完美配合
想要做好順暢配合,建議大家在項(xiàng)目啟動(dòng)前,先花時(shí)間梳理好:到底要解決什么問題。而不是一上來先說:我要個(gè)模型。先捏個(gè)模型出來,再拿著錘子找釘子。
如果要解決的問題本身不清晰,比如:
- 診斷類問題:到底指標(biāo)異動(dòng)是因?yàn)閮?nèi)部還是外部原因?
- 標(biāo)準(zhǔn)類問題:到底該怎么定義“高價(jià)值用戶”、“有效的策略”?
- 測(cè)試類問題:我有個(gè)新想法,還沒實(shí)行,不知道有沒有效果?
此時(shí)建議做業(yè)務(wù)模型,先把問題梳理清楚,把定義明確好,拿到測(cè)試數(shù)據(jù),再看進(jìn)一步怎么做?
如果要解決的問題定義清晰,且有數(shù)據(jù)積累,就很適合做算法模型。特別是即使業(yè)務(wù)很努力,也很難提升效果的時(shí)候,比如用戶流失挽留,新用戶電話銷售等場(chǎng)景,天然響應(yīng)率低,通過模型篩選目標(biāo)群體能極大提升業(yè)務(wù)效率,此時(shí)效果好。
本文由人人都是產(chǎn)品經(jīng)理作者【接地氣的陳老師】,微信公眾號(hào):【接地氣的陳老師】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
為啥語音閱讀沒有啦。