AI產(chǎn)品經(jīng)理的入門必修——概念篇

8 評論 13489 瀏覽 128 收藏 17 分鐘

編輯導語:隨著各行各業(yè)的豐富,產(chǎn)品經(jīng)理的崗位職責也越來越細致;如今科技發(fā)展迅速,AI人工智能已經(jīng)開始深入生活中,AI產(chǎn)品經(jīng)理也需要掌握一定的技能;本文作者分享了關(guān)于AI產(chǎn)品經(jīng)理的學習概念分享,我們一起來看一下。

經(jīng)過近幾年來的發(fā)展,產(chǎn)品經(jīng)理的崗位職責劃分的越來越細,對能力的要求也越來越高。

很多剛接手做AI產(chǎn)品的童鞋會困擾,到底需要對人工智能技術(shù)掌握到什么程度才能夠勝任好這份工作;筆者通過自身的學習經(jīng)驗,期望能以此篇文章為剛?cè)胄谢蛘呦肴胄械耐蜷_一些學習思路。

一、工欲善其事,必先利其器

AI產(chǎn)品經(jīng)理除了要掌握通用的產(chǎn)品技能,需要具有更強的專業(yè)性、廣博性和條理性;AI技術(shù)作為一種新的生產(chǎn)力,處理了過往技術(shù)無法處理的復雜的非結(jié)構(gòu)化數(shù)據(jù)。

很多人在使用機器學習時,喜歡簡單粗暴的將數(shù)據(jù)丟給算法模型,期望從數(shù)據(jù)中自己得到結(jié)論;AI絕不是將手中的數(shù)據(jù)喂給它,就能夠解決我們的業(yè)務(wù)問題。

很多公司老板容易AI超神論,認為我們掌握了技術(shù),擁有了人才,就能夠建立自己的護城河;作為產(chǎn)品經(jīng)理需要清楚的理解機器學習的使用場景和邊界,清晰定位問題才能尋找新的市場機會。

1. 產(chǎn)品規(guī)劃:五看三定原則

五看三定模型其實是華為的戰(zhàn)略管理框架,現(xiàn)在把它結(jié)合到產(chǎn)品的工作中。

1)五看包括:

看行業(yè)/趨勢:

  • 結(jié)合公開的行業(yè)數(shù)據(jù)、現(xiàn)有的業(yè)務(wù)數(shù)據(jù)、產(chǎn)品數(shù)據(jù)分析未來趨勢走向,為業(yè)務(wù)發(fā)展尋找新的增長點。
  • 不僅要看宏觀的經(jīng)濟因素還要從群體思想、政治關(guān)系等角度去切入,可以結(jié)合PEST方法進行分析,即政治、經(jīng)濟、社會、技術(shù)分別分析企業(yè)的外部環(huán)境。

看市場/客戶:確定需求強度,需求可替代性,以及客戶的持續(xù)付費能力。

看競爭:當前市場的競爭態(tài)勢,有多少玩家在里面,分別占據(jù)了怎樣的市場份額。

看自己:評估內(nèi)部資源,現(xiàn)有的產(chǎn)品矩陣。

看機會:是否存在彎道超車的機會,做到人無我有,人有我優(yōu)。

2)三定包括:

定控制點:簡單可理解為一種不易被構(gòu)建及超越的中長期競爭力,控制有不同的維度,如成本優(yōu)勢、功能性能的領(lǐng)先、技術(shù)的壁壘、品牌與客戶關(guān)系、絕對的市場份額等。

定目標:制定清晰的戰(zhàn)略目標,并拆解為最小任務(wù),分步執(zhí)行、監(jiān)控、評估。

定策略:策略即戰(zhàn)術(shù),策略的制定決定了后續(xù)的資源分配、系統(tǒng)如何組成。

2. 選擇產(chǎn)品類型

在開展新的業(yè)務(wù)線時,首先問自己幾個問題:我們的護城河在哪?最終產(chǎn)品形態(tài)是什么樣子?我們?yōu)槭袌鎏峁┝嗽鯓拥慕鉀Q方案?服務(wù)方式?服務(wù)能力?

面對不同的業(yè)務(wù)線首先要做到戰(zhàn)略洞察所處環(huán)境與價值分析,制定清晰的戰(zhàn)略目標和策略,通過五看三定原則合理的找到產(chǎn)品定位。

先發(fā)型產(chǎn)品:

擁有最快路徑、利用產(chǎn)業(yè)升級進行驅(qū)動、建立核心門檻和護城河、資源消耗輕、塑造行業(yè)標準。

趕超型產(chǎn)品:

擁有最優(yōu)路徑、差異化的競爭驅(qū)動、對標核心競品,尋找機會、研發(fā)資源投入較多、達到行業(yè)標準以上、做好客戶服務(wù)。

二、數(shù)據(jù)需要懂多少?

1. 建立數(shù)據(jù)認知

數(shù)據(jù)與信息的關(guān)系:

數(shù)據(jù)反映在事物屬性的記錄上,而信息是具體事物的表現(xiàn)形式,即數(shù)據(jù)經(jīng)過加工和處理后,可揭示和轉(zhuǎn)化為信息。

信息被識別后表示的符號為數(shù)據(jù)。

  • 數(shù)據(jù)可以是連續(xù)的值比如聲音、圖像,也可以是離散的值,比如文字、符號;
  • 計算機系統(tǒng)中,數(shù)據(jù)是以二進制0、1形式表示;

結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù):

結(jié)構(gòu)化的數(shù)據(jù)簡單可以理解為數(shù)據(jù)庫中的數(shù)據(jù),可以結(jié)合具體的使用場景易于理解的數(shù)據(jù)。

非結(jié)構(gòu)化的數(shù)據(jù)是指沒有進行預定義,并且不方便用二維邏輯來表現(xiàn)和解釋的數(shù)據(jù),比如文本、圖片、音頻、視頻。

何為臟數(shù)據(jù):數(shù)據(jù)不再我們預先定義的范圍內(nèi)或?qū)嶋H業(yè)務(wù)無意義。

2. 了解數(shù)據(jù)的業(yè)務(wù)內(nèi)涵

理解數(shù)據(jù)的業(yè)務(wù)內(nèi)涵是非常關(guān)鍵的一步,這要求產(chǎn)品經(jīng)理對業(yè)務(wù)的各個流程和關(guān)鍵節(jié)點要非常的熟悉,理解數(shù)據(jù)代表的含義;遇到模糊、定義不清晰的數(shù)據(jù)要充分與業(yè)務(wù)部門溝通,準確了解數(shù)據(jù)內(nèi)涵。

業(yè)務(wù)數(shù)據(jù)包含但不局限于:

  • 用戶數(shù)據(jù):用戶ID、性別、年齡、地區(qū)、手機號…
  • 行為數(shù)據(jù):點擊、分享、收藏、停留時間…
  • 產(chǎn)品數(shù)據(jù):商品數(shù)據(jù)、訂單數(shù)據(jù)、文章數(shù)據(jù)、詳情頁數(shù)據(jù)…

業(yè)務(wù)指標包含但不局限于:

  • 用戶指標:新增用戶、活躍用戶數(shù)、留存用戶數(shù)..
  • 行為指標:訪問次數(shù)、轉(zhuǎn)化率、轉(zhuǎn)發(fā)率、流失率..
  • 產(chǎn)品指標:總量、收入、銷量、好評率、差評率、成交量…

業(yè)務(wù)數(shù)據(jù)不獨立存在,基于不同的業(yè)務(wù)背景可傳達出不同的含義,數(shù)據(jù)的計算重組可發(fā)揮出極大的業(yè)務(wù)價值,需要基于自身的工作場景挖掘數(shù)據(jù)內(nèi)涵。

3. 數(shù)據(jù)處理流程和方法

數(shù)據(jù)處理流程包含了數(shù)據(jù)采集->數(shù)據(jù)處理->數(shù)據(jù)分析->數(shù)據(jù)應用->持續(xù)跟蹤和驗證。

數(shù)據(jù)采集:

AI產(chǎn)品經(jīng)理的入門必修課——概念篇

數(shù)據(jù)處理:

AI產(chǎn)品經(jīng)理的入門必修課——概念篇

數(shù)據(jù)分析:

AI產(chǎn)品經(jīng)理的入門必修課——概念篇

數(shù)據(jù)應用:

AI產(chǎn)品經(jīng)理的入門必修課——概念篇

除此之外根據(jù)具體要解決的業(yè)務(wù)問題,還需要完成業(yè)務(wù)建模、數(shù)學建模、經(jīng)驗數(shù)據(jù)分析,此部分通常由數(shù)據(jù)分析師進行,產(chǎn)品經(jīng)理涉及較少。

三、機器學習是什么?

機器學習為計算機提供了不同的數(shù)據(jù)處理方法,這些處理數(shù)據(jù)的方法可以直接從數(shù)據(jù)中學習,不需要額外的編程即可做出預測。

我們可以將機器學習簡單理解為函數(shù),像理解y=x2 一樣,給到一個輸入項,通過公式的計算即可得出一個對應的計算結(jié)果;這個公式不需要編碼預設(shè)邏輯,由數(shù)據(jù)的規(guī)律計算得出。

機器學習過程分為訓練階段和預測階段。

訓練階段需要提前準備一定的歷史數(shù)據(jù)(即公式的x和y),通過機器學習算法,訓練出一套可計算的公式(即模型)。

預測階段就是拿真實的數(shù)據(jù)(x),在訓練好的模型上進行輸入,觀察輸出的結(jié)果(y),是否符合預期,若符合預期即完成了一個機器學習模型的訓練。

1. 從任務(wù)來看

機器學習解決的問題可以歸為分類問題、預測問題。

分類問題包含二分類、多分類,顧名思義,二分類問題是非此即彼的問題,如垃圾郵件,只存在是垃圾郵件、不是垃圾郵件。

圖片識別問題,是植物不是植物。

多分類問題如文檔自動歸類,包含了一對多,多對多的關(guān)系。

預測問題通常第一反應就會想到回歸,因為常被用來預測公司收入、業(yè)務(wù)增長量、商品銷量。

需要預估的通常都是連續(xù)值,試圖將輸入變量和輸出用一個連續(xù)函數(shù)對應起來。

而分類問題,通常預測的都是離散值,試圖將輸入變量與離散的類別對應起來。

還有一類特殊的解決問題的模型為結(jié)構(gòu)化學習模型,通常輸出的數(shù)據(jù)不再是一個固定長度的值,比如圖片語義分析,對應輸出的是圖片對應的文字描述。

2. 從機器學習方法來看

機器學習分為有監(jiān)督學習、半監(jiān)督學習、無監(jiān)督學習、遷移學習、強化學習。

  • 有監(jiān)督:訓練樣本帶有標簽;
  • 半監(jiān)督:訓練樣本部分有標簽,部分無標簽;
  • 無監(jiān)督:訓練樣本全部無標簽;
  • 遷移學習:把已經(jīng)訓練好的模型參數(shù)遷移到新的模型上來幫助新模型的訓練;
  • 強化學習:也叫學習最優(yōu)策略,是可以讓本體在特定環(huán)境下,根據(jù)不同狀態(tài)做出行動,以此來獲得最大回報。

3. 從模型類別來看

機器學習模型主要分為線性模型、非線性模型。

線性模型是指因變量和自變量之間按比例表現(xiàn)出線性對應關(guān)系,包含了線性回歸、多項式回歸。

公式表現(xiàn)為——h(x)=w1x1+w2x2+?+wnxn+b

非線性模型通常是指因變量與自變量間不能在坐標空間中表現(xiàn)出線性對應關(guān)系。

常見的SVM、KNN、決策樹、深度學習都屬于非線性模型。

提到線性、非線性模型,我們必須要了解一下什么是損失函數(shù),通常在模型訓練的過程中,我們需要觀察h(x)與y之間的差距,也就是均方誤差,在線性模型中表現(xiàn)為L(h)=m∑i=1(y(i)?h(x(i)))2,在模型訓練過程中,損失函數(shù)是作為度量函數(shù)好壞的標準。

需要注意的是在面對不同的問題時,所使用的損失函數(shù)形式是存在差異的,常見的損失函數(shù)有均方差損失函數(shù)、交叉熵損失函數(shù)、合頁損失函數(shù),通常會配合不同的算法使用做出突出表現(xiàn)。

4. 常見的誤差

泛化誤差:可以分解為偏差、方差和噪聲之和。

偏差:反映了模型在樣本上的期望輸出與真實標記之間的差距,指模型本身的精準度,以及擬合能力。

方差:反映了模型在不同訓練數(shù)據(jù)集下學得的函數(shù)的輸出與期望輸出之間的誤差,通常是為了測試模型的穩(wěn)定性,觀察預估結(jié)果的波動情況。

在模型訓練過程中,需要根據(jù)實際情況來權(quán)衡模型的復雜度,使偏差和方差得到均衡,以整體誤差最小的原則去評估。

5. 常見的問題

模型訓練中常常遇到欠擬合、過擬合的情況,那么怎么識別及解決呢?

欠擬合:通常是指模型刻畫不夠,解決方案通常有三種。

  • 尋找更好的特征提升數(shù)據(jù)刻畫能力。
  • 增大數(shù)據(jù)集數(shù)量。
  • 模型復雜度低,重新選擇更加復雜的模型。

過擬合:與欠擬合相反,模型刻畫太細,泛化能力太差。

通常解決方案為:

  • 減少特征的維度,將高維空間密度增大,也就是通常說的降維。
  • 加入正則化項,使模型褶皺減少,更加平滑。

四、算法需要懂多少?

確認算法的流程通常是由產(chǎn)品經(jīng)理和算法工程師共同完成,包含:需求確定 -> 算法設(shè)計 -> 算法討論 -> 算法確認 -> 算法驗收 -> 持續(xù)改進。

算法模型的選擇和訓練是個繁瑣且復雜的過程,依賴于具體所解決問題的復雜程度。產(chǎn)品經(jīng)理除了要明確定位要解決的核心問題,還需要了解模型訓練的整個流程。

很多人會說產(chǎn)品經(jīng)理不需要了解這么多,不是還有算法工程師嗎?

理想情況下,如果你的算法工程師能夠充分了解要解決的業(yè)務(wù)場景,并將數(shù)據(jù)可解決問題的上限、下限劃定清楚,產(chǎn)品經(jīng)理只需驗收數(shù)據(jù)效果即可。

但通常情況下,算法工程師距離業(yè)務(wù)線較遠,而機器學習強依賴于數(shù)據(jù)表現(xiàn),產(chǎn)品經(jīng)理對業(yè)務(wù)數(shù)據(jù)的識別能力,通常能夠極大的加快整體進度,在訓練過程中能夠及時識別問題并調(diào)整策略及解決方案。

產(chǎn)品經(jīng)理對算法的掌握到底需要達到什么程度呢?

個人認為只需要掌握常見算法模型的原理和使用場景,以及不同算法在解決不同問題的優(yōu)勢和劣勢,合理組合和使用即可滿足日常的工作需求。不需要糾結(jié)于具體的算法推導過程。

五、機器學習常見的算法模型

針對不同的使用場景,scikit-learn(python機器學習庫)上有封裝好的機器學習算法模型可以支持我們直接調(diào)用。

下圖為人工整理的關(guān)于不同場景及數(shù)據(jù)集下建議使用的算法模型,僅供學習和參考。

AI產(chǎn)品經(jīng)理的入門必修課——概念篇

下期將介紹具體的機器學習訓練過程,包含如何梳理業(yè)務(wù)邏輯、需求轉(zhuǎn)化、準備數(shù)據(jù)集、建立算法模型、模型評估及訓練過程中常出現(xiàn)的問題與解決方案。

#專欄作家#

大鵬,公眾號:一個數(shù)據(jù)人的自留地。人人都是產(chǎn)品經(jīng)理專欄作家,《數(shù)據(jù)產(chǎn)品經(jīng)理修煉手冊》作者。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議。

作者:一個圓圈兒

本文由 @一個數(shù)據(jù)人的自留地 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來自 Pixabay,基于 CC0 協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 不錯

    來自上海 回復
  2. 想入行的菜雞,沒看懂。。。

    來自浙江 回復
  3. 最后一個圖。。。

    來自江蘇 回復
  4. 平安健康

    回復
  5. 好文比較全面,能提供一些案例就更好了

    回復
  6. 好文,最后一張圖看不太清就是了

    來自北京 回復
  7. 希望繼續(xù)寫下去,對剛?cè)胄腥藛T很有幫助

    來自浙江 回復
  8. 寫的很好!很適合入門,不過感覺對非本領(lǐng)域的還是不太友好地!

    來自福建 回復