AI產(chǎn)品經(jīng)理的入門必修——概念篇
編輯導語:隨著各行各業(yè)的豐富,產(chǎn)品經(jīng)理的崗位職責也越來越細致;如今科技發(fā)展迅速,AI人工智能已經(jīng)開始深入生活中,AI產(chǎn)品經(jīng)理也需要掌握一定的技能;本文作者分享了關(guān)于AI產(chǎn)品經(jīng)理的學習概念分享,我們一起來看一下。
經(jīng)過近幾年來的發(fā)展,產(chǎn)品經(jīng)理的崗位職責劃分的越來越細,對能力的要求也越來越高。
很多剛接手做AI產(chǎn)品的童鞋會困擾,到底需要對人工智能技術(shù)掌握到什么程度才能夠勝任好這份工作;筆者通過自身的學習經(jīng)驗,期望能以此篇文章為剛?cè)胄谢蛘呦肴胄械耐蜷_一些學習思路。
一、工欲善其事,必先利其器
AI產(chǎn)品經(jīng)理除了要掌握通用的產(chǎn)品技能,需要具有更強的專業(yè)性、廣博性和條理性;AI技術(shù)作為一種新的生產(chǎn)力,處理了過往技術(shù)無法處理的復雜的非結(jié)構(gòu)化數(shù)據(jù)。
很多人在使用機器學習時,喜歡簡單粗暴的將數(shù)據(jù)丟給算法模型,期望從數(shù)據(jù)中自己得到結(jié)論;AI絕不是將手中的數(shù)據(jù)喂給它,就能夠解決我們的業(yè)務(wù)問題。
很多公司老板容易AI超神論,認為我們掌握了技術(shù),擁有了人才,就能夠建立自己的護城河;作為產(chǎn)品經(jīng)理需要清楚的理解機器學習的使用場景和邊界,清晰定位問題才能尋找新的市場機會。
1. 產(chǎn)品規(guī)劃:五看三定原則
五看三定模型其實是華為的戰(zhàn)略管理框架,現(xiàn)在把它結(jié)合到產(chǎn)品的工作中。
1)五看包括:
看行業(yè)/趨勢:
- 結(jié)合公開的行業(yè)數(shù)據(jù)、現(xiàn)有的業(yè)務(wù)數(shù)據(jù)、產(chǎn)品數(shù)據(jù)分析未來趨勢走向,為業(yè)務(wù)發(fā)展尋找新的增長點。
- 不僅要看宏觀的經(jīng)濟因素還要從群體思想、政治關(guān)系等角度去切入,可以結(jié)合PEST方法進行分析,即政治、經(jīng)濟、社會、技術(shù)分別分析企業(yè)的外部環(huán)境。
看市場/客戶:確定需求強度,需求可替代性,以及客戶的持續(xù)付費能力。
看競爭:當前市場的競爭態(tài)勢,有多少玩家在里面,分別占據(jù)了怎樣的市場份額。
看自己:評估內(nèi)部資源,現(xiàn)有的產(chǎn)品矩陣。
看機會:是否存在彎道超車的機會,做到人無我有,人有我優(yōu)。
2)三定包括:
定控制點:簡單可理解為一種不易被構(gòu)建及超越的中長期競爭力,控制有不同的維度,如成本優(yōu)勢、功能性能的領(lǐng)先、技術(shù)的壁壘、品牌與客戶關(guān)系、絕對的市場份額等。
定目標:制定清晰的戰(zhàn)略目標,并拆解為最小任務(wù),分步執(zhí)行、監(jiān)控、評估。
定策略:策略即戰(zhàn)術(shù),策略的制定決定了后續(xù)的資源分配、系統(tǒng)如何組成。
2. 選擇產(chǎn)品類型
在開展新的業(yè)務(wù)線時,首先問自己幾個問題:我們的護城河在哪?最終產(chǎn)品形態(tài)是什么樣子?我們?yōu)槭袌鎏峁┝嗽鯓拥慕鉀Q方案?服務(wù)方式?服務(wù)能力?
面對不同的業(yè)務(wù)線首先要做到戰(zhàn)略洞察所處環(huán)境與價值分析,制定清晰的戰(zhàn)略目標和策略,通過五看三定原則合理的找到產(chǎn)品定位。
先發(fā)型產(chǎn)品:
擁有最快路徑、利用產(chǎn)業(yè)升級進行驅(qū)動、建立核心門檻和護城河、資源消耗輕、塑造行業(yè)標準。
趕超型產(chǎn)品:
擁有最優(yōu)路徑、差異化的競爭驅(qū)動、對標核心競品,尋找機會、研發(fā)資源投入較多、達到行業(yè)標準以上、做好客戶服務(wù)。
二、數(shù)據(jù)需要懂多少?
1. 建立數(shù)據(jù)認知
數(shù)據(jù)與信息的關(guān)系:
數(shù)據(jù)反映在事物屬性的記錄上,而信息是具體事物的表現(xiàn)形式,即數(shù)據(jù)經(jīng)過加工和處理后,可揭示和轉(zhuǎn)化為信息。
信息被識別后表示的符號為數(shù)據(jù)。
- 數(shù)據(jù)可以是連續(xù)的值比如聲音、圖像,也可以是離散的值,比如文字、符號;
- 計算機系統(tǒng)中,數(shù)據(jù)是以二進制0、1形式表示;
結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù):
結(jié)構(gòu)化的數(shù)據(jù)簡單可以理解為數(shù)據(jù)庫中的數(shù)據(jù),可以結(jié)合具體的使用場景易于理解的數(shù)據(jù)。
非結(jié)構(gòu)化的數(shù)據(jù)是指沒有進行預定義,并且不方便用二維邏輯來表現(xiàn)和解釋的數(shù)據(jù),比如文本、圖片、音頻、視頻。
何為臟數(shù)據(jù):數(shù)據(jù)不再我們預先定義的范圍內(nèi)或?qū)嶋H業(yè)務(wù)無意義。
2. 了解數(shù)據(jù)的業(yè)務(wù)內(nèi)涵
理解數(shù)據(jù)的業(yè)務(wù)內(nèi)涵是非常關(guān)鍵的一步,這要求產(chǎn)品經(jīng)理對業(yè)務(wù)的各個流程和關(guān)鍵節(jié)點要非常的熟悉,理解數(shù)據(jù)代表的含義;遇到模糊、定義不清晰的數(shù)據(jù)要充分與業(yè)務(wù)部門溝通,準確了解數(shù)據(jù)內(nèi)涵。
業(yè)務(wù)數(shù)據(jù)包含但不局限于:
- 用戶數(shù)據(jù):用戶ID、性別、年齡、地區(qū)、手機號…
- 行為數(shù)據(jù):點擊、分享、收藏、停留時間…
- 產(chǎn)品數(shù)據(jù):商品數(shù)據(jù)、訂單數(shù)據(jù)、文章數(shù)據(jù)、詳情頁數(shù)據(jù)…
業(yè)務(wù)指標包含但不局限于:
- 用戶指標:新增用戶、活躍用戶數(shù)、留存用戶數(shù)..
- 行為指標:訪問次數(shù)、轉(zhuǎn)化率、轉(zhuǎn)發(fā)率、流失率..
- 產(chǎn)品指標:總量、收入、銷量、好評率、差評率、成交量…
業(yè)務(wù)數(shù)據(jù)不獨立存在,基于不同的業(yè)務(wù)背景可傳達出不同的含義,數(shù)據(jù)的計算重組可發(fā)揮出極大的業(yè)務(wù)價值,需要基于自身的工作場景挖掘數(shù)據(jù)內(nèi)涵。
3. 數(shù)據(jù)處理流程和方法
數(shù)據(jù)處理流程包含了數(shù)據(jù)采集->數(shù)據(jù)處理->數(shù)據(jù)分析->數(shù)據(jù)應用->持續(xù)跟蹤和驗證。
數(shù)據(jù)采集:
數(shù)據(jù)處理:
數(shù)據(jù)分析:
數(shù)據(jù)應用:
除此之外根據(jù)具體要解決的業(yè)務(wù)問題,還需要完成業(yè)務(wù)建模、數(shù)學建模、經(jīng)驗數(shù)據(jù)分析,此部分通常由數(shù)據(jù)分析師進行,產(chǎn)品經(jīng)理涉及較少。
三、機器學習是什么?
機器學習為計算機提供了不同的數(shù)據(jù)處理方法,這些處理數(shù)據(jù)的方法可以直接從數(shù)據(jù)中學習,不需要額外的編程即可做出預測。
我們可以將機器學習簡單理解為函數(shù),像理解y=x2 一樣,給到一個輸入項,通過公式的計算即可得出一個對應的計算結(jié)果;這個公式不需要編碼預設(shè)邏輯,由數(shù)據(jù)的規(guī)律計算得出。
機器學習過程分為訓練階段和預測階段。
訓練階段需要提前準備一定的歷史數(shù)據(jù)(即公式的x和y),通過機器學習算法,訓練出一套可計算的公式(即模型)。
預測階段就是拿真實的數(shù)據(jù)(x),在訓練好的模型上進行輸入,觀察輸出的結(jié)果(y),是否符合預期,若符合預期即完成了一個機器學習模型的訓練。
1. 從任務(wù)來看
機器學習解決的問題可以歸為分類問題、預測問題。
分類問題包含二分類、多分類,顧名思義,二分類問題是非此即彼的問題,如垃圾郵件,只存在是垃圾郵件、不是垃圾郵件。
圖片識別問題,是植物不是植物。
多分類問題如文檔自動歸類,包含了一對多,多對多的關(guān)系。
預測問題通常第一反應就會想到回歸,因為常被用來預測公司收入、業(yè)務(wù)增長量、商品銷量。
需要預估的通常都是連續(xù)值,試圖將輸入變量和輸出用一個連續(xù)函數(shù)對應起來。
而分類問題,通常預測的都是離散值,試圖將輸入變量與離散的類別對應起來。
還有一類特殊的解決問題的模型為結(jié)構(gòu)化學習模型,通常輸出的數(shù)據(jù)不再是一個固定長度的值,比如圖片語義分析,對應輸出的是圖片對應的文字描述。
2. 從機器學習方法來看
機器學習分為有監(jiān)督學習、半監(jiān)督學習、無監(jiān)督學習、遷移學習、強化學習。
- 有監(jiān)督:訓練樣本帶有標簽;
- 半監(jiān)督:訓練樣本部分有標簽,部分無標簽;
- 無監(jiān)督:訓練樣本全部無標簽;
- 遷移學習:把已經(jīng)訓練好的模型參數(shù)遷移到新的模型上來幫助新模型的訓練;
- 強化學習:也叫學習最優(yōu)策略,是可以讓本體在特定環(huán)境下,根據(jù)不同狀態(tài)做出行動,以此來獲得最大回報。
3. 從模型類別來看
機器學習模型主要分為線性模型、非線性模型。
線性模型是指因變量和自變量之間按比例表現(xiàn)出線性對應關(guān)系,包含了線性回歸、多項式回歸。
公式表現(xiàn)為——h(x)=w1x1+w2x2+?+wnxn+b
非線性模型通常是指因變量與自變量間不能在坐標空間中表現(xiàn)出線性對應關(guān)系。
常見的SVM、KNN、決策樹、深度學習都屬于非線性模型。
提到線性、非線性模型,我們必須要了解一下什么是損失函數(shù),通常在模型訓練的過程中,我們需要觀察h(x)與y之間的差距,也就是均方誤差,在線性模型中表現(xiàn)為L(h)=m∑i=1(y(i)?h(x(i)))2,在模型訓練過程中,損失函數(shù)是作為度量函數(shù)好壞的標準。
需要注意的是在面對不同的問題時,所使用的損失函數(shù)形式是存在差異的,常見的損失函數(shù)有均方差損失函數(shù)、交叉熵損失函數(shù)、合頁損失函數(shù),通常會配合不同的算法使用做出突出表現(xiàn)。
4. 常見的誤差
泛化誤差:可以分解為偏差、方差和噪聲之和。
偏差:反映了模型在樣本上的期望輸出與真實標記之間的差距,指模型本身的精準度,以及擬合能力。
方差:反映了模型在不同訓練數(shù)據(jù)集下學得的函數(shù)的輸出與期望輸出之間的誤差,通常是為了測試模型的穩(wěn)定性,觀察預估結(jié)果的波動情況。
在模型訓練過程中,需要根據(jù)實際情況來權(quán)衡模型的復雜度,使偏差和方差得到均衡,以整體誤差最小的原則去評估。
5. 常見的問題
模型訓練中常常遇到欠擬合、過擬合的情況,那么怎么識別及解決呢?
欠擬合:通常是指模型刻畫不夠,解決方案通常有三種。
- 尋找更好的特征提升數(shù)據(jù)刻畫能力。
- 增大數(shù)據(jù)集數(shù)量。
- 模型復雜度低,重新選擇更加復雜的模型。
過擬合:與欠擬合相反,模型刻畫太細,泛化能力太差。
通常解決方案為:
- 減少特征的維度,將高維空間密度增大,也就是通常說的降維。
- 加入正則化項,使模型褶皺減少,更加平滑。
四、算法需要懂多少?
確認算法的流程通常是由產(chǎn)品經(jīng)理和算法工程師共同完成,包含:需求確定 -> 算法設(shè)計 -> 算法討論 -> 算法確認 -> 算法驗收 -> 持續(xù)改進。
算法模型的選擇和訓練是個繁瑣且復雜的過程,依賴于具體所解決問題的復雜程度。產(chǎn)品經(jīng)理除了要明確定位要解決的核心問題,還需要了解模型訓練的整個流程。
很多人會說產(chǎn)品經(jīng)理不需要了解這么多,不是還有算法工程師嗎?
理想情況下,如果你的算法工程師能夠充分了解要解決的業(yè)務(wù)場景,并將數(shù)據(jù)可解決問題的上限、下限劃定清楚,產(chǎn)品經(jīng)理只需驗收數(shù)據(jù)效果即可。
但通常情況下,算法工程師距離業(yè)務(wù)線較遠,而機器學習強依賴于數(shù)據(jù)表現(xiàn),產(chǎn)品經(jīng)理對業(yè)務(wù)數(shù)據(jù)的識別能力,通常能夠極大的加快整體進度,在訓練過程中能夠及時識別問題并調(diào)整策略及解決方案。
產(chǎn)品經(jīng)理對算法的掌握到底需要達到什么程度呢?
個人認為只需要掌握常見算法模型的原理和使用場景,以及不同算法在解決不同問題的優(yōu)勢和劣勢,合理組合和使用即可滿足日常的工作需求。不需要糾結(jié)于具體的算法推導過程。
五、機器學習常見的算法模型
針對不同的使用場景,scikit-learn(python機器學習庫)上有封裝好的機器學習算法模型可以支持我們直接調(diào)用。
下圖為人工整理的關(guān)于不同場景及數(shù)據(jù)集下建議使用的算法模型,僅供學習和參考。
下期將介紹具體的機器學習訓練過程,包含如何梳理業(yè)務(wù)邏輯、需求轉(zhuǎn)化、準備數(shù)據(jù)集、建立算法模型、模型評估及訓練過程中常出現(xiàn)的問題與解決方案。
#專欄作家#
大鵬,公眾號:一個數(shù)據(jù)人的自留地。人人都是產(chǎn)品經(jīng)理專欄作家,《數(shù)據(jù)產(chǎn)品經(jīng)理修煉手冊》作者。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議。
作者:一個圓圈兒
本文由 @一個數(shù)據(jù)人的自留地 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自 Pixabay,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
不錯
想入行的菜雞,沒看懂。。。
最后一個圖。。。
平安健康
好文比較全面,能提供一些案例就更好了
好文,最后一張圖看不太清就是了
希望繼續(xù)寫下去,對剛?cè)胄腥藛T很有幫助
寫的很好!很適合入門,不過感覺對非本領(lǐng)域的還是不太友好地!