5個步驟,教你學(xué)會商業(yè)數(shù)據(jù)分析

2 評論 37192 瀏覽 124 收藏 8 分鐘

很多商業(yè)案例分析都離不開數(shù)據(jù)的支撐,因此掌握數(shù)據(jù)分析的方法就顯得十分重要了。

呈現(xiàn)在我們眼前所有精彩的商業(yè)案例分析,如果溯其論點(diǎn)的來源,都是脫離不了底層的數(shù)據(jù)支撐的。所以,懂點(diǎn)數(shù)據(jù)分析很有必要。Allen今天就給大家分享一下自己日常是如何做數(shù)據(jù)分析的。

Ps:講的不是數(shù)據(jù)分析師方向,而是日常的基礎(chǔ)數(shù)據(jù)分析思路

通常Allen在做數(shù)據(jù)分析時,會把數(shù)據(jù)分析拆分為5個步驟來進(jìn)行(收集、清洗、對比、細(xì)分、溯源)。下面一一展開來講。

一.數(shù)據(jù)收集

當(dāng)我們在做數(shù)據(jù)分析時,第一步要解決的問題肯定就是數(shù)據(jù)源的問題。Allen通常把數(shù)據(jù)分為二大類。

  • 第一類是直接能獲取的數(shù)據(jù),通常都是內(nèi)部數(shù)據(jù)。無非就是從網(wǎng)站后臺或者是自己家的數(shù)據(jù)庫里面導(dǎo)。
  • 第二類就是外部數(shù)據(jù),需要經(jīng)過加工整理后得到的數(shù)據(jù)。

典型的數(shù)據(jù)來源有:

百度指數(shù):http://index.baidu.com/ (分析市場容量)

阿里指數(shù):https://alizs.taobao.com/(分析銷量、份額)

梅花網(wǎng):http://adm.meihua.info/ (分析廣告投放)

CNZZ、微博指數(shù)等等。。。。

當(dāng)然還有很多很多有價值的數(shù)據(jù)源(根據(jù)行業(yè)、需要找到最合適自己的數(shù)據(jù)源),上面列舉的三個典型的數(shù)據(jù)源只為舉例子之用。在這里要著重提一點(diǎn),第三方數(shù)據(jù)來源往往需要考慮數(shù)據(jù)源真實(shí)度。

二.數(shù)據(jù)清洗

清洗數(shù)據(jù)(篩選、清除、補(bǔ)充、糾正)的目的無非是從大量的、雜亂無章、難以理解的數(shù)據(jù)中抽取并推導(dǎo)出對解決問題有價值、有意義的數(shù)據(jù)。清洗后、保存下來真正有價值、有條理的數(shù)據(jù),為后面做數(shù)據(jù)分析減少分析障礙。這里不詳述

三.數(shù)據(jù)對比

對比,是數(shù)據(jù)分析的切入點(diǎn)。因?yàn)槿绻麤]參照物,數(shù)據(jù)就沒有一個定量的評估標(biāo)準(zhǔn)。通常情況下我們從二個點(diǎn)去切入進(jìn)行數(shù)據(jù)對比分析:1.橫向?qū)Ρ?2.縱向?qū)Ρ?/strong>

橫向?qū)Ρ龋c行業(yè)平均數(shù)據(jù),與競爭對手的數(shù)據(jù)進(jìn)行比對。舉個粟子,比如你家的APP用戶留存率是60%,而行業(yè)平均留存是70%或競爭對手的用戶留存率是70%,那就說明你家的產(chǎn)品在留存率方面有待加強(qiáng)!

縱向?qū)Ρ?,與自家產(chǎn)品的歷史數(shù)據(jù)進(jìn)行對比,圍繞著時間軸來對比。還是用用戶留存率來進(jìn)行舉粟子吧,比如,APP改版前30天,新用戶留存率是70%的,而新版APP發(fā)布后,新用戶留存率降了10%或者升了5%,這就產(chǎn)生了問題,到底是那些因素導(dǎo)致數(shù)據(jù)產(chǎn)生了異常呢?

要知道數(shù)據(jù)比對是發(fā)現(xiàn)問題的第一步,發(fā)現(xiàn)了問題才需要我去找出問題,并解決它。如果沒有參考的對象,單獨(dú)的數(shù)據(jù)放在那里,是沒意義的。

四.數(shù)據(jù)細(xì)分

數(shù)據(jù)對比發(fā)現(xiàn)了異常,我們當(dāng)然想知道是什么原因?qū)е碌摹_@里就要用到數(shù)據(jù)細(xì)分了,數(shù)據(jù)細(xì)分通常情況下先分緯度,再分粒度。

何謂為緯度?按時間分類就是時間緯度,按地區(qū)分類就是地域緯度,按來路分類就是來源緯度,按受訪頁面分類就是受訪緯度。今天APP訪問量漲了5%,咋回事不知道,你細(xì)分一看,大部分網(wǎng)頁都沒漲,某個頻道某個活動頁漲了300%,這就清楚了,這就是細(xì)分最簡單的范例,其實(shí)很多領(lǐng)域都通用。

粒度是什么?你時間緯度,是按照天,還是按照小時?這就是粒度差異,你來路緯度,是來路的網(wǎng)站,還是來路的url,這就是粒度的差異;緯度結(jié)合粒度進(jìn)行細(xì)分,就可以將對比的差異值逐級鎖定問題區(qū)域,就可以更容易地尋找出發(fā)生問題的原因了。

五.數(shù)據(jù)溯源

通常情況下,通過數(shù)據(jù)細(xì)分就能分析出大多數(shù)問題的原因并推導(dǎo)出結(jié)論了。但也有特殊的情況,即使具體到粒度了也得不出有說服力的結(jié)論。

這時候我們再進(jìn)一步,通過數(shù)據(jù)溯源就能找出問題的原因。依據(jù)鎖定的這個緯度和粒度作為搜索條件,查詢所涉及的源日志,源記錄,然后基于此分析和反思用戶的行為,往往會有驚人的發(fā)現(xiàn)。

又或者結(jié)合用戶使用場景去思考,比如:國內(nèi)的社交產(chǎn)品,在上下班的時間段會特別活躍,而該產(chǎn)品經(jīng)理對比美國地區(qū)卻發(fā)現(xiàn)在美國地區(qū)用戶的上班活躍數(shù)據(jù)恰恰相反,特別低,到底是什么原因呢??磾?shù)據(jù)怎么也看不出來,怎么辦呢?若果該產(chǎn)品經(jīng)理結(jié)合用戶上班時的使用場景去思考就能一眼看出問題,因?yàn)閲鴥?nèi)的上班一族通常上是通過公交、地鐵等公共交通工具去上班的,所以他們有大把的時間在玩社交,刷朋友圈。而美國地區(qū)的上班一族,大多數(shù)都是自駕車去上班(車輪上的國家),他們上班時間都在專心地開車,根本沒有時間去玩手機(jī),玩社交產(chǎn)品。

其實(shí),Allen在以往工作的時候就基于這一邏輯發(fā)現(xiàn)過一些產(chǎn)品的一些缺陷,而且你不斷通過這個方式分析數(shù)據(jù),對用戶行為的理解也會逐步加深。

最后,作個簡單的總結(jié):馬云粑粑說阿里管理有三板斧:揪頭發(fā)、照鏡子、聞味道。而同樣,在數(shù)據(jù)分析這里,則是五板斧:收集、清洗、對比、細(xì)分、溯源。這是數(shù)據(jù)分析里最核心的最實(shí)用的“一口箱子”。

#專欄作家#

Allen,個人微信:qq1186974614,偉朋投資行業(yè)分析師,歡迎交流。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 不錯哦 很細(xì)致

    來自湖北 回復(fù)
  2. 說的很好??!

    來自北京 回復(fù)