国内day老头Day,8090电影天堂网,国产精品午睡沙发系列

搜索

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業(yè)技能直播

會員專屬社群

榮耀標識

發(fā)布

注冊 | 登錄

AI產(chǎn)品經(jīng)理的入門必修——概念篇

一個數(shù)據(jù)人的自留地

2020-12-02

8 評論 13489 瀏覽 128 收藏

17 分鐘

編輯導語：隨著各行各業(yè)的豐富，產(chǎn)品經(jīng)理的崗位職責也越來越細致；如今科技發(fā)展迅速，AI人工智能已經(jīng)開始深入生活中，AI產(chǎn)品經(jīng)理也需要掌握一定的技能；本文作者分享了關(guān)于AI產(chǎn)品經(jīng)理的學習概念分享，我們一起來看一下。

經(jīng)過近幾年來的發(fā)展，產(chǎn)品經(jīng)理的崗位職責劃分的越來越細，對能力的要求也越來越高。

很多剛接手做AI產(chǎn)品的童鞋會困擾，到底需要對人工智能技術(shù)掌握到什么程度才能夠勝任好這份工作；筆者通過自身的學習經(jīng)驗，期望能以此篇文章為剛?cè)胄谢蛘呦肴胄械耐蜷_一些學習思路。

一、工欲善其事，必先利其器

AI產(chǎn)品經(jīng)理除了要掌握通用的產(chǎn)品技能，需要具有更強的專業(yè)性、廣博性和條理性；AI技術(shù)作為一種新的生產(chǎn)力，處理了過往技術(shù)無法處理的復雜的非結(jié)構(gòu)化數(shù)據(jù)。

很多人在使用機器學習時，喜歡簡單粗暴的將數(shù)據(jù)丟給算法模型，期望從數(shù)據(jù)中自己得到結(jié)論；AI絕不是將手中的數(shù)據(jù)喂給它，就能夠解決我們的業(yè)務(wù)問題。

很多公司老板容易AI超神論，認為我們掌握了技術(shù)，擁有了人才，就能夠建立自己的護城河；作為產(chǎn)品經(jīng)理需要清楚的理解機器學習的使用場景和邊界，清晰定位問題才能尋找新的市場機會。

1. 產(chǎn)品規(guī)劃：五看三定原則

五看三定模型其實是華為的戰(zhàn)略管理框架，現(xiàn)在把它結(jié)合到產(chǎn)品的工作中。

1）五看包括：

看行業(yè)/趨勢：

結(jié)合公開的行業(yè)數(shù)據(jù)、現(xiàn)有的業(yè)務(wù)數(shù)據(jù)、產(chǎn)品數(shù)據(jù)分析未來趨勢走向，為業(yè)務(wù)發(fā)展尋找新的增長點。
不僅要看宏觀的經(jīng)濟因素還要從群體思想、政治關(guān)系等角度去切入，可以結(jié)合PEST方法進行分析，即政治、經(jīng)濟、社會、技術(shù)分別分析企業(yè)的外部環(huán)境。

看市場/客戶：確定需求強度，需求可替代性，以及客戶的持續(xù)付費能力。

看競爭：當前市場的競爭態(tài)勢，有多少玩家在里面，分別占據(jù)了怎樣的市場份額。

看自己：評估內(nèi)部資源，現(xiàn)有的產(chǎn)品矩陣。

看機會：是否存在彎道超車的機會，做到人無我有，人有我優(yōu)。

2）三定包括：

定控制點：簡單可理解為一種不易被構(gòu)建及超越的中長期競爭力，控制有不同的維度，如成本優(yōu)勢、功能性能的領(lǐng)先、技術(shù)的壁壘、品牌與客戶關(guān)系、絕對的市場份額等。

定目標：制定清晰的戰(zhàn)略目標，并拆解為最小任務(wù)，分步執(zhí)行、監(jiān)控、評估。

定策略：策略即戰(zhàn)術(shù)，策略的制定決定了后續(xù)的資源分配、系統(tǒng)如何組成。

2. 選擇產(chǎn)品類型

在開展新的業(yè)務(wù)線時，首先問自己幾個問題：我們的護城河在哪？最終產(chǎn)品形態(tài)是什么樣子？我們?yōu)槭袌鎏峁┝嗽鯓拥慕鉀Q方案？服務(wù)方式？服務(wù)能力？

面對不同的業(yè)務(wù)線首先要做到戰(zhàn)略洞察所處環(huán)境與價值分析，制定清晰的戰(zhàn)略目標和策略，通過五看三定原則合理的找到產(chǎn)品定位。

先發(fā)型產(chǎn)品：

擁有最快路徑、利用產(chǎn)業(yè)升級進行驅(qū)動、建立核心門檻和護城河、資源消耗輕、塑造行業(yè)標準。

趕超型產(chǎn)品：

擁有最優(yōu)路徑、差異化的競爭驅(qū)動、對標核心競品，尋找機會、研發(fā)資源投入較多、達到行業(yè)標準以上、做好客戶服務(wù)。

二、數(shù)據(jù)需要懂多少？

1. 建立數(shù)據(jù)認知

數(shù)據(jù)與信息的關(guān)系：

數(shù)據(jù)反映在事物屬性的記錄上，而信息是具體事物的表現(xiàn)形式，即數(shù)據(jù)經(jīng)過加工和處理后，可揭示和轉(zhuǎn)化為信息。

信息被識別后表示的符號為數(shù)據(jù)。

數(shù)據(jù)可以是連續(xù)的值比如聲音、圖像，也可以是離散的值，比如文字、符號；
計算機系統(tǒng)中，數(shù)據(jù)是以二進制0、1形式表示；

結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)：

結(jié)構(gòu)化的數(shù)據(jù)簡單可以理解為數(shù)據(jù)庫中的數(shù)據(jù)，可以結(jié)合具體的使用場景易于理解的數(shù)據(jù)。

非結(jié)構(gòu)化的數(shù)據(jù)是指沒有進行預定義，并且不方便用二維邏輯來表現(xiàn)和解釋的數(shù)據(jù)，比如文本、圖片、音頻、視頻。

何為臟數(shù)據(jù)：數(shù)據(jù)不再我們預先定義的范圍內(nèi)或?qū)嶋H業(yè)務(wù)無意義。

2. 了解數(shù)據(jù)的業(yè)務(wù)內(nèi)涵

理解數(shù)據(jù)的業(yè)務(wù)內(nèi)涵是非常關(guān)鍵的一步，這要求產(chǎn)品經(jīng)理對業(yè)務(wù)的各個流程和關(guān)鍵節(jié)點要非常的熟悉，理解數(shù)據(jù)代表的含義；遇到模糊、定義不清晰的數(shù)據(jù)要充分與業(yè)務(wù)部門溝通，準確了解數(shù)據(jù)內(nèi)涵。

業(yè)務(wù)數(shù)據(jù)包含但不局限于：

用戶數(shù)據(jù)：用戶ID、性別、年齡、地區(qū)、手機號…
行為數(shù)據(jù)：點擊、分享、收藏、停留時間…
產(chǎn)品數(shù)據(jù)：商品數(shù)據(jù)、訂單數(shù)據(jù)、文章數(shù)據(jù)、詳情頁數(shù)據(jù)…

業(yè)務(wù)指標包含但不局限于：

用戶指標：新增用戶、活躍用戶數(shù)、留存用戶數(shù)..
行為指標：訪問次數(shù)、轉(zhuǎn)化率、轉(zhuǎn)發(fā)率、流失率..
產(chǎn)品指標：總量、收入、銷量、好評率、差評率、成交量…

業(yè)務(wù)數(shù)據(jù)不獨立存在，基于不同的業(yè)務(wù)背景可傳達出不同的含義，數(shù)據(jù)的計算重組可發(fā)揮出極大的業(yè)務(wù)價值，需要基于自身的工作場景挖掘數(shù)據(jù)內(nèi)涵。

3. 數(shù)據(jù)處理流程和方法

數(shù)據(jù)處理流程包含了數(shù)據(jù)采集->數(shù)據(jù)處理->數(shù)據(jù)分析->數(shù)據(jù)應用->持續(xù)跟蹤和驗證。

數(shù)據(jù)采集：

AI產(chǎn)品經(jīng)理的入門必修課——概念篇

數(shù)據(jù)處理：

AI產(chǎn)品經(jīng)理的入門必修課——概念篇

數(shù)據(jù)分析：

AI產(chǎn)品經(jīng)理的入門必修課——概念篇

數(shù)據(jù)應用：

AI產(chǎn)品經(jīng)理的入門必修課——概念篇

除此之外根據(jù)具體要解決的業(yè)務(wù)問題，還需要完成業(yè)務(wù)建模、數(shù)學建模、經(jīng)驗數(shù)據(jù)分析，此部分通常由數(shù)據(jù)分析師進行，產(chǎn)品經(jīng)理涉及較少。

三、機器學習是什么？

機器學習為計算機提供了不同的數(shù)據(jù)處理方法，這些處理數(shù)據(jù)的方法可以直接從數(shù)據(jù)中學習，不需要額外的編程即可做出預測。

我們可以將機器學習簡單理解為函數(shù)，像理解y=x2 一樣，給到一個輸入項，通過公式的計算即可得出一個對應的計算結(jié)果；這個公式不需要編碼預設(shè)邏輯，由數(shù)據(jù)的規(guī)律計算得出。

機器學習過程分為訓練階段和預測階段。

訓練階段需要提前準備一定的歷史數(shù)據(jù)（即公式的x和y），通過機器學習算法，訓練出一套可計算的公式（即模型）。

預測階段就是拿真實的數(shù)據(jù)（x），在訓練好的模型上進行輸入，觀察輸出的結(jié)果（y），是否符合預期，若符合預期即完成了一個機器學習模型的訓練。

1. 從任務(wù)來看

機器學習解決的問題可以歸為分類問題、預測問題。

分類問題包含二分類、多分類，顧名思義，二分類問題是非此即彼的問題，如垃圾郵件，只存在是垃圾郵件、不是垃圾郵件。

圖片識別問題，是植物不是植物。

多分類問題如文檔自動歸類，包含了一對多，多對多的關(guān)系。

預測問題通常第一反應就會想到回歸，因為常被用來預測公司收入、業(yè)務(wù)增長量、商品銷量。

需要預估的通常都是連續(xù)值，試圖將輸入變量和輸出用一個連續(xù)函數(shù)對應起來。

而分類問題，通常預測的都是離散值，試圖將輸入變量與離散的類別對應起來。

還有一類特殊的解決問題的模型為結(jié)構(gòu)化學習模型，通常輸出的數(shù)據(jù)不再是一個固定長度的值，比如圖片語義分析，對應輸出的是圖片對應的文字描述。

2. 從機器學習方法來看

機器學習分為有監(jiān)督學習、半監(jiān)督學習、無監(jiān)督學習、遷移學習、強化學習。

有監(jiān)督：訓練樣本帶有標簽；
半監(jiān)督：訓練樣本部分有標簽，部分無標簽；
無監(jiān)督：訓練樣本全部無標簽；
遷移學習：把已經(jīng)訓練好的模型參數(shù)遷移到新的模型上來幫助新模型的訓練；
強化學習：也叫學習最優(yōu)策略，是可以讓本體在特定環(huán)境下，根據(jù)不同狀態(tài)做出行動，以此來獲得最大回報。

3. 從模型類別來看

機器學習模型主要分為線性模型、非線性模型。

線性模型是指因變量和自變量之間按比例表現(xiàn)出線性對應關(guān)系，包含了線性回歸、多項式回歸。

公式表現(xiàn)為——h(x)=w1x1+w2x2+?+wnxn+b

非線性模型通常是指因變量與自變量間不能在坐標空間中表現(xiàn)出線性對應關(guān)系。

常見的SVM、KNN、決策樹、深度學習都屬于非線性模型。

提到線性、非線性模型，我們必須要了解一下什么是損失函數(shù)，通常在模型訓練的過程中，我們需要觀察h(x)與y之間的差距，也就是均方誤差，在線性模型中表現(xiàn)為L(h)=m∑i=1(y(i)?h(x(i)))2，在模型訓練過程中，損失函數(shù)是作為度量函數(shù)好壞的標準。

需要注意的是在面對不同的問題時，所使用的損失函數(shù)形式是存在差異的，常見的損失函數(shù)有均方差損失函數(shù)、交叉熵損失函數(shù)、合頁損失函數(shù)，通常會配合不同的算法使用做出突出表現(xiàn)。

4. 常見的誤差

泛化誤差：可以分解為偏差、方差和噪聲之和。

偏差：反映了模型在樣本上的期望輸出與真實標記之間的差距，指模型本身的精準度，以及擬合能力。

方差：反映了模型在不同訓練數(shù)據(jù)集下學得的函數(shù)的輸出與期望輸出之間的誤差，通常是為了測試模型的穩(wěn)定性，觀察預估結(jié)果的波動情況。

在模型訓練過程中，需要根據(jù)實際情況來權(quán)衡模型的復雜度，使偏差和方差得到均衡，以整體誤差最小的原則去評估。

5. 常見的問題

模型訓練中常常遇到欠擬合、過擬合的情況，那么怎么識別及解決呢？

欠擬合：通常是指模型刻畫不夠，解決方案通常有三種。

尋找更好的特征提升數(shù)據(jù)刻畫能力。
增大數(shù)據(jù)集數(shù)量。
模型復雜度低，重新選擇更加復雜的模型。

過擬合：與欠擬合相反，模型刻畫太細，泛化能力太差。

通常解決方案為：

減少特征的維度，將高維空間密度增大，也就是通常說的降維。
加入正則化項，使模型褶皺減少，更加平滑。

四、算法需要懂多少？

確認算法的流程通常是由產(chǎn)品經(jīng)理和算法工程師共同完成，包含：需求確定 -> 算法設(shè)計 -> 算法討論 -> 算法確認 -> 算法驗收 -> 持續(xù)改進。

算法模型的選擇和訓練是個繁瑣且復雜的過程，依賴于具體所解決問題的復雜程度。產(chǎn)品經(jīng)理除了要明確定位要解決的核心問題，還需要了解模型訓練的整個流程。

很多人會說產(chǎn)品經(jīng)理不需要了解這么多，不是還有算法工程師嗎？

理想情況下，如果你的算法工程師能夠充分了解要解決的業(yè)務(wù)場景，并將數(shù)據(jù)可解決問題的上限、下限劃定清楚，產(chǎn)品經(jīng)理只需驗收數(shù)據(jù)效果即可。

但通常情況下，算法工程師距離業(yè)務(wù)線較遠，而機器學習強依賴于數(shù)據(jù)表現(xiàn)，產(chǎn)品經(jīng)理對業(yè)務(wù)數(shù)據(jù)的識別能力，通常能夠極大的加快整體進度，在訓練過程中能夠及時識別問題并調(diào)整策略及解決方案。

產(chǎn)品經(jīng)理對算法的掌握到底需要達到什么程度呢？

個人認為只需要掌握常見算法模型的原理和使用場景，以及不同算法在解決不同問題的優(yōu)勢和劣勢，合理組合和使用即可滿足日常的工作需求。不需要糾結(jié)于具體的算法推導過程。

五、機器學習常見的算法模型

針對不同的使用場景，scikit-learn（python機器學習庫）上有封裝好的機器學習算法模型可以支持我們直接調(diào)用。

下圖為人工整理的關(guān)于不同場景及數(shù)據(jù)集下建議使用的算法模型，僅供學習和參考。

AI產(chǎn)品經(jīng)理的入門必修課——概念篇

下期將介紹具體的機器學習訓練過程，包含如何梳理業(yè)務(wù)邏輯、需求轉(zhuǎn)化、準備數(shù)據(jù)集、建立算法模型、模型評估及訓練過程中常出現(xiàn)的問題與解決方案。

#專欄作家#

大鵬，公眾號：一個數(shù)據(jù)人的自留地。人人都是產(chǎn)品經(jīng)理專欄作家，《數(shù)據(jù)產(chǎn)品經(jīng)理修煉手冊》作者。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可，禁止轉(zhuǎn)載

題圖來自Unsplash，基于CC0協(xié)議。

作者：一個圓圈兒

本文由 @一個數(shù)據(jù)人的自留地授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)作者許可，禁止轉(zhuǎn)載

題圖來自 Pixabay，基于 CC0 協(xié)議

該文觀點僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App

AI產(chǎn)品經(jīng)理需要掌握的AI技術(shù)文章被收錄于該專欄

共 13 篇文章17678 人已學習

一個數(shù)據(jù)人的自留地

一個數(shù)據(jù)人的自留地，成就每一個數(shù)據(jù)人。

132篇作品 1639827總閱讀量

在公眾號發(fā)布商業(yè)合作內(nèi)容，要注意這3點

08-179801 瀏覽

AIGC初學者：Stable Diffusion高效實操指南

07-243941 瀏覽

固定直播入口，美團“陣戰(zhàn)”抖音

07-141861 瀏覽

百麗三十而立：“鞋王”DTC之路的陣痛與重生

03-258742 瀏覽

iOS17 公測版終于來了，我決定讓同事都升一波

07-143475 瀏覽

評論

周左左

不錯

最近來自上海回復
弓長張

想入行的菜雞，沒看懂。。。

最近來自浙江回復
cxxbxxxbxx

最后一個圖。。。

最近來自江蘇回復
入坑了產(chǎn)品

平安健康

最近回復
249521452

好文比較全面，能提供一些案例就更好了

最近回復
Jamie

好文，最后一張圖看不太清就是了

最近來自北京回復
xusf

希望繼續(xù)寫下去，對剛?cè)胄腥藛T很有幫助

最近來自浙江回復
輝輝輝哥

寫的很好！很適合入門，不過感覺對非本領(lǐng)域的還是不太友好地！

最近來自福建回復

年中盤點 | 小紅書最新動態(tài)及種草趨勢

07-146368 瀏覽
開源才是大模型的未來？

12-261106 瀏覽
同一品類產(chǎn)品在小紅書上不同投放策略，帶來投產(chǎn)效率相差近10倍？

09-281612 瀏覽

AI產(chǎn)品經(jīng)理的入門必修——概念篇

一、工欲善其事，必先利其器

1. 產(chǎn)品規(guī)劃：五看三定原則

2. 選擇產(chǎn)品類型

二、數(shù)據(jù)需要懂多少？

1. 建立數(shù)據(jù)認知

2. 了解數(shù)據(jù)的業(yè)務(wù)內(nèi)涵

3. 數(shù)據(jù)處理流程和方法

三、機器學習是什么？

1. 從任務(wù)來看

2. 從機器學習方法來看

3. 從模型類別來看

4. 常見的誤差

5. 常見的問題

四、算法需要懂多少？

五、機器學習常見的算法模型

#專欄作家#

一、工欲善其事，必先利其器

二、數(shù)據(jù)需要懂多少？

三、機器學習是什么？

四、算法需要懂多少？