模型思維和策略思維:為什么你做的模型總是沒用?

3 評論 3636 瀏覽 6 收藏 9 分鐘

你有沒有遇到這樣的情況:自己做的模型總是沒用,也估計不出什么結(jié)果來?本文以給小學(xué)生學(xué)習(xí)能力打分為例,分析如何使用模型思維和策略思維,希望對你有所幫助。

想象你是一個小學(xué)校長,要給全體小學(xué)生的學(xué)習(xí)能力打分,或者說給所有人打上好學(xué)生、差學(xué)生的標簽。你會怎么打?

拿出六年級的學(xué)生,因為他們考試考得多可靠度高,所有考試或者近期考試里面好成績占比特別高的,定義為好學(xué)生,特別低的定義為差學(xué)生。然后用所有你能撈到的信息如家庭背景、興趣愛好等,去訓(xùn)練一個分類模型,最后對所有一到六年級的學(xué)生進行預(yù)測。

你確定一定以及肯定不會這么做,這是舍本逐末,很荒唐。如果你把這個任務(wù)留給各班班主任,你會發(fā)現(xiàn)他們一定是采用了另一種做法。

六年級的人考過很多試,當(dāng)然很好定義,根據(jù)歷史成績尤其是近期成績直接打就行。一年級的人只考了幾次試,那也要根據(jù)語文數(shù)學(xué)美術(shù)音樂體育品德等學(xué)科成績?nèi)ヅ袛喟。@就是說服力最強的。低年級的置信度肯定沒有那么高,但也比用喜歡吃什么東西、打不打球、回家看不看電視這些場外因素預(yù)測強。所有學(xué)生的打標就依靠學(xué)科成績和體現(xiàn)出來的一些特性判斷就是最有效的。

第一種做法,是模型思維。在這個場景里,你根本不會去倚重模型思維,你甚至覺得模型的思路很可笑。但是,換個場景,你沒有在做這種可笑的事情嗎?

第二種做法,是策略思維。你根據(jù)最重要的信息,把這個打分策略做出來了。

當(dāng)你用模型思維去解決問題的時候,你有沒有發(fā)現(xiàn),你可以解決任何問題。你可以用你撈到的那些東西,去預(yù)測一個人是不是有錢、是不是gay、是不是有出軌潛力、是不是有暴力傾向、是不是很卷、是不是想跳槽、是不是黃賭毒、是不是喜歡說栓Q、會不會扶老奶奶過馬路、擠牙膏是從中間擠還是兩頭擠、刷碗是順時針還是逆時針……

我們是來解決問題的,解決問題沒那么容易,一板斧走到黑怎么能行呢?你還得會二板斧三板斧……

當(dāng)你用策略思維的時候,你會想各種辦法去解決問題。例如,用一個問題替代原來的問題是一個解決難題的好策略。也就是說,如果你無法解決某個問題,就去解決另外一個簡單點的問題好了,去找這個簡單的問題吧。

還是用風(fēng)控舉例,信用風(fēng)險當(dāng)然可以直接預(yù)測,也可以拆解問題,低收入的人風(fēng)險高,高負債的人風(fēng)險高等等,于是解決這兩個子問題可以對終極問題有所裨益。

上面給小學(xué)生學(xué)習(xí)能力打分的問題,你覺得模型思維很可笑。但實際上,收入、負債也是一樣,去預(yù)測是很奇怪的,當(dāng)然不是說一定不可以。

至于說為什么風(fēng)險可以預(yù)測,收入和負債不能呢?我認為在一個以風(fēng)險為評價目標的預(yù)測中,因為預(yù)測和真值永遠是有誤差的,收入負債預(yù)測存在一次誤差,而收入負債和風(fēng)險的關(guān)系并不是絕對的,也就是說傳導(dǎo)到風(fēng)險識別上這個誤差是要疊乘的。預(yù)測結(jié)果必然可用性不高。

收入和負債模塊更合適的做法是,去定義不要去預(yù)測。用你所有能獲取到的相關(guān)數(shù)據(jù),按可靠程度高低,想盡辦法對齊,直接寫case when。

一句話總結(jié),上面說到的模型思維和策略思維的區(qū)別就在于如何定義這個y。模型思維是隨便定義了一小部分樣本的y,然后找X來預(yù)測;策略思維是想盡辦法好不容易定義了這個盡可能覆蓋全的y,然后沒有然后。

前者容易還是后者容易,朋友們?不要自欺欺人,前者容易得多,多一個模型預(yù)測的環(huán)節(jié)根本不構(gòu)成辦法的難度。問問自己,是不是只會做前者,不會做后者?

做模型,我們都喜歡端到端的解決方案,因為端到端的解決方案是最簡單的。但有時候它不起作用。

你根本就不知道你做出來的是什么東西。你說要測試,反正可以測嘛?你覺得總是有用的,但事實是隨便做的都是無用的。好的策略應(yīng)該是簡單且合乎邏輯的,模型思維做出來的模型做不到這一點,你只能相信數(shù)據(jù),只能去測試。然后測試回來沒有用。

另一個問題是,端到端的解決辦法總是要基于歷史數(shù)據(jù),如果你的歷史做得很好還行,如果本來就不行,學(xué)習(xí)歷史來發(fā)展未來有什么意義呢?

況且,歷史數(shù)據(jù)往往是有條件的,去掉這個條件,你的模型很可能會出大問題。舉個財富管理的例子,歷史用戶都是有100w+持倉的平臺高粘性用戶,現(xiàn)在想找更多高凈值高潛客戶,于是你完成了建模,去掉了歷史持倉100w+的條件,找出來一批高評分的所謂“高潛”用戶。這個評分在歷史數(shù)據(jù)上表現(xiàn)好就一定是有效的嗎?

如果你看見一個人在地鐵里閱讀《參考消息》,下面哪種情形與讀報者更吻合?他有博士學(xué)位,他沒有大學(xué)文憑。你可能會選有博士學(xué)位那個,但這樣做不一定是明智的。你應(yīng)該充分考慮第二種選項,因為地鐵里沒有大學(xué)文憑的人更多。

如果一個人被打標成詩歌愛好者,猜測她學(xué)的是中國古代文學(xué)還是工商管理,你也應(yīng)該選擇第二個答案。因為雖然學(xué)習(xí)中國古代文學(xué)的女學(xué)生更容易是詩歌愛好者,但幾乎可以肯定有更多的工商管理專業(yè)且愛好詩歌的女學(xué)生。

“張三是位30歲的男性,碩士學(xué)歷,已婚,但無子女。他在大廠工作,能力強、干勁足,很受同事歡迎?!边@樣的人在歷史數(shù)據(jù)里表現(xiàn)出來轉(zhuǎn)化率高,但拋開100w+的持倉,這樣的人高凈值的比例能低到嚇人。

遇到問題不管三七二十一就做個模型的人,我認為是用戰(zhàn)術(shù)上的勤奮來掩蓋戰(zhàn)略上的懶惰,這樣做模型不僅沒效果而且沒價值。我有一個判斷工作價值的辦法,如果經(jīng)驗不重要,那工作就是沒有價值的。

最后提醒一下。不要以為在土里插個溫度計,就可以測量整個地球的溫度了。

專欄作家

雷帥,微信公眾號:雷帥快與慢,人人都是產(chǎn)品經(jīng)理專欄作家。風(fēng)控算法工程師,懂點風(fēng)控、懂點業(yè)務(wù)、懂點人生。始終相信經(jīng)驗讓工作更簡單,繼而發(fā)現(xiàn)風(fēng)控讓人生更自由。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于CC0協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 還是沒太懂思維模型和策略模型的區(qū)別,可以再解釋一下嗎?

    來自重慶 回復(fù)
    1. 一句話概括為:模型思維是預(yù)測,策略思維是定義

      來自北京 回復(fù)
    2. 很可,作者本人來表示贊成

      來自香港 回復(fù)