盤點:數據分析中最基本的分析方法
編輯導語:在數據分析中,有各種各樣的分析方法供我們使用。復雜的分析方法固然好用,但是日常工作中經常用到的還是基礎的分析方法。本文作者為我們介紹了六種常見的分析方法,如果你能熟練的使用它們,相信能夠解決許多的日常數據分析問題。
日常數據分析中,尤其是業(yè)務分析中,常用的分析方法論主要是幾大類,本文會介紹我認為比較關鍵的六大類常用方法,熟練地混合交叉使用這六大類基本方法,80%的日常數據分析問題都能解決。
下面我會介紹這些方法有哪些,并且給出實例介紹如何使用這些方法。
一、多維分析
所謂多維分析就是細分分析,做多維分析首先要明確2個方向:維度和指標。
- 指標:指的是用來記錄關鍵流程的,衡量目標的單位或方法,如DAU、留存率、轉化率等。
- 維度:指的是觀察指標的角度,如時間、來源渠道、地理位置、產品版本維度等。
多維分析,就是在多個維度拆解,觀察對比維度細分下的指標。實現將一個綜合指標細分,從而發(fā)現更多問題。
舉個實際用途的例子,KPI拆解,制定明年的KPI目標:
- 第一步:指標拆解,商品營收=(新用戶數+老用戶數)×商品訂單轉化率×客單價;
- 第二步:對指標進行多維細分,新老用戶可以再細分客群,比如孕婦群體、運動愛好者、學生、白領等;商品訂單可以細分商品的類型、商品的價格、商品的供應商、商品的品牌影響力等;
- 第三步:根據歷史業(yè)務發(fā)展情況,計算不同用戶維度、不同商品維度下的商品營收;
- 第四步:求和不同用戶維度、不同商品維度下的商品營收,即為商品總營收。
在越來越講究精細化運營的今天,多維分析的作用越來越重要,管理層通??吹氖蔷C合指標,總值,但通常這些總值無法真正地發(fā)現問題。對于一線員工將總值拆解細分,才能發(fā)現問題,找到可落地的解決問題。
二、趨勢分析
有對比才有分析,有對比數據才能產生意義,所以對比分析在實際數據分析中是非常重要的一種分析手段,最常用的是基于時間的對比分析?;跁r間的對比分析,主要是指同一指標在不同時間周期的對比,主要分為同比、環(huán)比和定基比。
- 環(huán)比是指:與相鄰的上一周期做對比,周期可以是時、日、周、月、季、年等。比如周環(huán)比,指的是本周與上一周的對比;
- 同比是指:兩個周期同一個時間點的比較,目的是追蹤周期性的變化;
- 定基比是指:和指定的時間基點對比。
舉個數據例子:如2017年10月的月同比,指的是2017年10月和2016年10月做對比,而2017年10月的月環(huán)比,指的是2017年10月和上一周期2017年9月做對比。
三、轉化分析法(漏斗分析)
轉化分析也叫漏斗分析,主要是分析分析產品流程或關鍵節(jié)點的轉化效果,常借助漏斗圖展現轉化效果。
漏斗圖是一種外形類似漏斗的可視化圖表,該方法可以直觀追蹤產品的整體流程,追蹤業(yè)務的轉化路徑,追蹤不同生命階段下的用戶群體表現。漏斗分析常用的場景主要有:
- 產品流程的關鍵路徑轉化追蹤,比如電商常用的購買流程;
- 業(yè)務價值路徑的轉化流程追蹤,比如常用的AARRR模型的價值轉化追蹤;
- 虛擬流程類指標追蹤,比如按生命周期區(qū)分的不同生命周期階段的用戶流轉形態(tài)追蹤。
舉個例子,針對AARRR模型轉化場景:
AARRR是Acquisition、Activation、Retention、Revenue、Refer這五個單詞的首字母縮寫。它主要闡述的是用戶從獲取到激活,到留存,到產生營收,到口碑認可正向傳播的一系列閉環(huán)效應。
我們可基于用戶量計算出這些節(jié)點的轉化率,從而判斷哪些節(jié)點的轉化率差,哪些節(jié)點還有優(yōu)化的空間,再通過具體的運營手段來提升節(jié)點轉化率。如下圖中的活躍購買率僅33%,是否可以運營手段將其提升到40%呢?
四、公式拆解法
所謂公式拆解法,就是對目標變量用已知公式進行拆解,從而快速找到影響目標變量的因素。公式拆解法沒有固定的標準,一個目標變量在不同的場景下或者說為解決不同問題,需要利用公式拆解的細致程度也不一樣。
常見的公式拆解的場景有:
1. GMV計算
GMV = 下單用戶量*客單價
=(新用戶+留存用戶+召回用戶)*客單價
= (廣告觸達量 * 轉化率 + 老用戶*留存率 + 召回觸達用戶量 * 召回率)* (商品量*商品單價)
2. ROI計算
ROI = 收益/成本
=(銷售單價*銷售量)/(固定成本+可變成本)
(收益和成本也可以繼續(xù)根據業(yè)務進行拆解)
3. DAU預估
A(n):第n天的新增用戶;R(n):第n天的留存率
DAU(n) = A(n) + DAU(n-1) * R(1)
= A(n) + A(n-1) * R(1) + DAU(n-2) * R(2)
= A(n)+A(n-1)R(1)+A(n-2)R(2)+… …+A(1)R(n-1)
4. 凈資產收益率ROE
ROE = 當前凈利潤/當期平均凈權益
= 利潤率 * 總資產周轉率 *財務杠桿
= 凈利潤/銷售收入 * 銷售收入/總資產 * 總資產/權益
根據公式對目標變量拆解后,我們通常會對拆解后的變量做更精細的分析,并且提出可落地解決問題的解決手段。
如下圖所示,這是電商/零食行業(yè)最常用的拆解解決問題的框架,為提升銷售額,在實際解決問題中都要細化到廣告拉新、用戶分析、商品分析等層面。
五、綜合評估法
綜合評估法是將多個指標綜合成一個指標評估的方法。這種方法是非常常見的,如我們日常中的螞蟻信用分、微博熱度、游戲戰(zhàn)績排名等都是基于綜合評估法實現的。
綜合評價法的特點表現為:
- 評價過程是通過一些特殊的方法,按指標的重要性對多指標加權,多個指標的評價是同時完成的,而非一個一個逐次完成的;
- 在多指標整合進行綜合評價指標的過程中,會涉及權重的設定;
- 綜合評價法生成的綜合指標不再是單純意義上的單個指標的意思,而是多個指標的綜合反映。
因此,對于綜合評估法,賦權是非常重要的環(huán)節(jié)。而賦權的方法可分為兩類:主觀評估法和客觀評估法。客觀評估法是指:變異系數、熵分析、主成分分析等;主觀評估法是指:層次分析法、專家賦權等。
1. 變異系數法
變異系數等于樣本標準差除以樣本均值,是衡量樣本觀測值變異程度的變量。而且因為變異系數是除以了樣本均值,所以他是忽略了量綱的影響。那具體如何用變異系數定權重呢,具體步驟可以看下面:
第一步:對于每一個指標計算變異系數cvcv_i=樣本標準差/樣本均值= σ/μ
第二步:計算各個指標最終的權重
基于以上的計算公式可以看出,對于變異系數法定義權重,如果一個指標可以明顯區(qū)分不同的樣本,那么就會有更高的權重;反之,如果樣本在某個指標的表現上沒有特別明顯,即該指標區(qū)分樣本的能力較弱,則應該給這個指標賦予比較小的權重。
2. 熵值法
熵的概念來源于熱力學,后來被引入信息論,用以表示對不確定性的一種度量。信息熵一般用來反映信息量的大小,信息量越大,不確定性越小,熵就越??;反之,信息量越小,不確定性越大,則熵就越大。
信息熵的計算方式如下:
假設有隨機變量X,對應的值分分別為x1, x2, …, xn對應的概率分別為pi,信息熵為:
具體基于信息熵計算權重的方法步驟如下:
第一步:計算指標的比重假設有n個樣本,m個指標,xij為第i個樣本第m個指標的值。因為不知道樣本對應的具體指標的概率,可以用m指標下n樣本對應的指標值占該指標總值的比率來表示。第xij指標的比重pij為:
第二步:計算第j項指標的熵值
第三步:計算各項指標的權重
第四步:計算各個樣本的綜合得分
計算出的綜合得分是[0,1],可通過開根號再乘以100的方式,將其映射到[0,100]。
3. 層次分析法
層次分析法(AHP)是運籌學中的概念,是指將與決策總是有關的元素分解成目標、準則、方案等層次,在此基礎之上進行定性和定量分析的決策方法。
如下所示,要計算總得分,可以將其拆解為質量、互動、消費、發(fā)布、附件這五個準則,對于這五個準則有再細分的方案。
那具體怎么定義權重,大體思路是:由專家分別在每一個準則的細分方案下,對細分方案兩兩之間評重要程度(如1-9,1是同等重要,9是一方極端重要)。
再基于重要程度,可通過層次分析法的計算公式計算出每個細分方案的權重;同理可對五個準則進行重要評估,從而計算出五個準則的權重。具體方法可百度,百度上有詳細的計算公式。
六、結構化分析
所謂結構化分析,其實就是邏輯樹和MECE的結合使用。
邏輯數是麥肯錫推廣的思考問題的工具,就是將目標問題像樹一層一層拆解,最左邊是“樹根”(目標/問題的起點),朝右是將某已知問題的影響層當成已知問題的樹枝,每多一個影響層,則添加一個樹枝,直到列出已知問題的所有影響層為止。
且各邏輯樹枝之間的關系需要“相互獨立、完全窮盡”(MECE)。
結構化分析是非常好用的一種方法,它能將問題層層有序拆解,有助于思路清晰,同時可以將復雜問題由繁化簡。下面以一個應用場景來舉例說明:
比如要分析某App用戶流失的原因,窮舉用戶流失的影響因素,做出邏輯樹。
雖說結構化分析非常好用,但是構建一個完美的框架(邏輯樹)可不是一件容易事,一般構建結構框架有兩種方法:自下而上和自上而下。
1. 自下而上
自下而上的意思是:先頭腦風暴羅列可能的影響因素,再對羅列的影響因素歸類分解形成框架。
下面以一個應用場景來舉例說明,比如如何在2年內賺到100萬元?
1)第一步:羅列要點
2)第二步:連線歸類
一般是從時間、結構、重要性三個維度進行歸類。
3)第三步:形成框架
4)第四步:檢查是否有重復和遺漏
2. 自上而下
自上而下的意思是:已經有可套用解決的框架,將需要解決的問題按照框架拆解,最后形成針對目標問題的結構框架?,F有的成熟的框架特別多,比如4P、4C、SWOT、PEST、5W2H等等。
3. 自上而下和自上而下對比
從上面的講解很容易看出兩種構建框架的區(qū)別,具體的對比整理如下,日常中可為了提高框架輸出能力而有針對性的訓練。
以上就是我要介紹的常用數據分析方法,掌握上述方法,我相信80%的數據分析問題都能得到合理的分析思路。但在實際場景中,很少僅用單一方法就能直接解決問題,大多數情況下都要綜合上述方法中的多種方法才可。
比如電商場景下的如何提升銷售額問題?就要用到公式法、轉化分析法、多維分析法及結構分析法,經過這樣一系列分解才能獲得可落地化的解決方案(公式拆解法里貼的示例圖就有比較詳細的邏輯拆解過程)。
本文由 @須臾即永恒 原創(chuàng)發(fā)布于人人都是產品經理,未經許可,禁止轉載
題圖來自 Unsplash,基于 CC0 協議
這些公式看不懂,太燒腦,也說明博主寫的很專業(yè)
請問結構化分析法是不是就是社邦分析法呀
杜邦分析法
很棒!!
作者這篇文章有理論,有案例的將數據分析方法講得通俗易懂,學習到不少,謝謝了
學習了 感謝~~