數(shù)據(jù)分析(1):三觀的建立

本篇文章主要分享了產(chǎn)品經(jīng)理數(shù)據(jù)分析技能的基礎(chǔ)認(rèn)知,所謂成大事,三觀要正。故起名數(shù)據(jù)分析:三觀的建立
一、數(shù)據(jù)分析的概念
數(shù)據(jù)分析大致可以分為三個(gè)層次(這邊沿用蘇格蘭折耳喵的部分觀點(diǎn)):
1)描述性數(shù)據(jù)分析
如果沒有系統(tǒng)學(xué)習(xí)過數(shù)據(jù)分析的一般處于這個(gè)階段,常用的方式:對(duì)比分析、平均分析、交叉分析等。
2)診斷性數(shù)據(jù)分析
從這個(gè)階段開始,才剛剛進(jìn)入真正的數(shù)據(jù)分析階段。這個(gè)階段可以運(yùn)用一些數(shù)據(jù)分析的方法論來對(duì)數(shù)據(jù)進(jìn)行解釋。如AARRR模型,PEST模型、5W2H、邏輯樹、用戶行為理論等。
3)預(yù)測(cè)性數(shù)據(jù)分析
運(yùn)用機(jī)器學(xué)習(xí)等方法建立模型,預(yù)測(cè)數(shù)據(jù)。
不同的人有不同的分類方法,但是萬變不離其宗。
數(shù)據(jù)分析的一般步驟是:
獲取數(shù)據(jù)、處理數(shù)據(jù)(抽樣、清洗等)、數(shù)據(jù)結(jié)果(數(shù)據(jù)處理后得到的一些統(tǒng)計(jì)量,我們平常用到留存率、活躍度等等都是)、分析原因(分析數(shù)據(jù)變化的原因,如可能是活動(dòng)帶來了活躍度的提升)、預(yù)測(cè)(提供決策參考)。
二、數(shù)據(jù)的來源
要進(jìn)行數(shù)據(jù)分析,首先得要有數(shù)據(jù)。數(shù)據(jù)可以分為內(nèi)部數(shù)據(jù)以及外部數(shù)據(jù)。又可以分為一手?jǐn)?shù)據(jù)和二手?jǐn)?shù)據(jù)。內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)容易理解,內(nèi)部數(shù)據(jù)即自己掌握的數(shù)據(jù),如埋點(diǎn)數(shù)據(jù)等。外部數(shù)據(jù)包括結(jié)構(gòu)化的如三方應(yīng)用市場(chǎng)的下載數(shù)據(jù)到非結(jié)構(gòu)化的評(píng)論數(shù)據(jù)。一手?jǐn)?shù)據(jù)主要指的是可以直接獲得的數(shù)據(jù),如埋點(diǎn)產(chǎn)生的數(shù)據(jù)就屬于一手?jǐn)?shù)據(jù)。二手?jǐn)?shù)據(jù)指的是經(jīng)過加工的數(shù)據(jù),如數(shù)據(jù)分析師給出的數(shù)據(jù),以及各種媒體給出的數(shù)據(jù)。
那么數(shù)據(jù)的來源有哪些呢?
1)數(shù)據(jù)庫
一般可以從公司內(nèi)部的數(shù)據(jù)庫中獲取想要的數(shù)據(jù)。如果沒有可以提出數(shù)據(jù)收集的需求。
2)公開出版物
國(guó)家統(tǒng)計(jì)網(wǎng)站、《中國(guó)統(tǒng)計(jì)年鑒》等。
3)數(shù)據(jù)平臺(tái)
cnzz統(tǒng)計(jì)、友盟等統(tǒng)計(jì)工具,基于自身產(chǎn)品是否有接入。
4)自建數(shù)據(jù)平臺(tái):
大廠一般都有自己的數(shù)據(jù)平臺(tái)。另外也有一些開源的數(shù)據(jù)平臺(tái)可以免費(fèi)使用,如airbnb的superset。
5)爬蟲抓?。?/strong>
這是最常見的一種方式,需要一定的編程基礎(chǔ)。不過現(xiàn)在也出現(xiàn)了一些采集器,如GooSeeker很大程度降低了門檻。
6)市場(chǎng)調(diào)研:
自己動(dòng)手豐衣足食,大學(xué)時(shí)候做論文沒少做過問卷調(diào)查,這里方法不再贅述。
三、數(shù)據(jù)分析的三觀
1)分析目的要明確:
數(shù)據(jù)分析一定要圍繞著目的進(jìn)行,而不是單純的擺數(shù)據(jù)。
2)掌握一定的數(shù)據(jù)分析手法,但是不要沉迷于手法:
數(shù)據(jù)分析的手法有很多,基礎(chǔ)的一定要掌握,如對(duì)比分析、分組分析、交叉分析、結(jié)構(gòu)分析、漏斗圖、因素分析、矩陣關(guān)聯(lián)。而高階的數(shù)據(jù)分析手法如邏輯回歸、主成分分析、因子分析等,一般作為產(chǎn)品經(jīng)理(非數(shù)據(jù)方向),用到的會(huì)比較少。所以可以做了解,有興趣的可以深入鉆研。但是要明白一點(diǎn)并不是手法越高級(jí)分析越準(zhǔn)確,合適的方式才是最準(zhǔn)確的。不要過分沉迷于高級(jí)手法,以分析目的為導(dǎo)向。
3)數(shù)據(jù)分析要結(jié)合業(yè)務(wù):
產(chǎn)品經(jīng)理相對(duì)于數(shù)據(jù)分析師的優(yōu)勢(shì)就是更懂業(yè)務(wù)。懂業(yè)務(wù)有什么好處呢?可以很輕易的理解數(shù)據(jù)分析師可能理解不了的一些數(shù)據(jù)的關(guān)聯(lián)性。如著名的“啤酒”與“尿布”的案例。結(jié)合業(yè)務(wù)進(jìn)行數(shù)據(jù)分析,才能更好理解數(shù)據(jù)背后的真相。
四、數(shù)據(jù)分析的工具
數(shù)據(jù)分析的工具沒有孰好孰壞,適合自己的就是最好的。介紹一下我們常用的數(shù)據(jù)分析工具:
1)Excel:
我們最熟悉的Excel是一款出色的數(shù)據(jù)分析工具,雖然大多數(shù)人只是把它當(dāng)成表格?;旧弦呀?jīng)夠用了!但是畢竟不是為統(tǒng)計(jì)而生的軟件,如果常使用高級(jí)分析手法的人會(huì)覺得不順手,因?yàn)橐恍┯?jì)算沒有被封裝好,還得自己寫。不如直接用專用的統(tǒng)計(jì)工具。
2)SPSS:
毫無疑問,說道統(tǒng)計(jì)工具無人不知SPSS,統(tǒng)計(jì)必備,提供了很多分析方法。
3)Python:
Python明顯和上面不是一個(gè)類別的玩意兒,為什么我把它列出來是因?yàn)轭A(yù)測(cè)型的數(shù)據(jù)分析離不開機(jī)器學(xué)習(xí),說道機(jī)器學(xué)習(xí)就不得不提python,至于為什么是python不是本篇重點(diǎn),有興趣可以自行查找相關(guān)材料。python主要推薦anaconda,它解決了各種數(shù)據(jù)科學(xué)的依賴包,對(duì)于不熟悉python的人簡(jiǎn)直就是福音。
4)R:
R就是為統(tǒng)計(jì)而生的語言。專業(yè)性較強(qiáng),適合統(tǒng)計(jì)學(xué)背景的大神使用。
5)其他:
JMP、SAS、XLstat等等。有興趣可以自行查找資料。
本文由 @?躚塵 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自PEXELS,基于CC0協(xié)議
- 目前還沒評(píng)論,等你發(fā)揮!