SQL足以解決你的問題,別動(dòng)不動(dòng)就是機(jī)器學(xué)習(xí)

6 評(píng)論 8210 瀏覽 20 收藏 12 分鐘

一些有趣的技術(shù)和概念如雨后春筍般冒出來——機(jī)器學(xué)習(xí)、區(qū)塊鏈、人工智能、虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)等等,而有些現(xiàn)有的技術(shù)則開始退居二線。

不久前,我發(fā)了一個(gè)推文,說我們需要使用傳統(tǒng)和已有的工具來解決日常業(yè)務(wù)問題,而不是去攀附那些性感時(shí)髦卻又復(fù)雜的技術(shù)。

人們對(duì)這個(gè)推文反應(yīng)十分強(qiáng)烈,最終成了 Hackernews 的頭條。這個(gè)推文引發(fā)了一些有趣的對(duì)話。有的人贊同我的觀點(diǎn),有些人則完全反對(duì),還罵我是蠢。好吧,互聯(lián)網(wǎng)本來就是個(gè)“狂野的西部”。

我寫這篇文章并不是想要說服你什么,而是打算對(duì)之前推文的內(nèi)容做進(jìn)一步說明。

隨著歲月的流逝,一些有趣的技術(shù)和概念如雨后春筍般冒出來——機(jī)器學(xué)習(xí)、區(qū)塊鏈、人工智能、虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)等等,而有些現(xiàn)有的技術(shù)則開始退居二線。經(jīng)常聽到有人基于區(qū)塊鏈技術(shù)開發(fā)出優(yōu)秀的產(chǎn)品來。

我見過基于區(qū)塊鏈技術(shù)的電子商務(wù)服務(wù)、社交網(wǎng)絡(luò)和版權(quán),而這類應(yīng)用程序還在不斷增加中。據(jù)說現(xiàn)階段你要快速及早地融到資金,必須與“區(qū)塊鏈”扯上關(guān)系,即使從宏觀上看它與區(qū)塊鏈可能并沒有任何關(guān)聯(lián)。

在區(qū)塊鏈之前是機(jī)器學(xué)習(xí)和人工智能(ML/AI),幾乎所有帶有“加入候補(bǔ)名單”字段的登陸頁都會(huì)出現(xiàn) ML/AI。如果你的頁面上沒有提到 AI,好像天會(huì)塌下來一樣。但說真的,你們真的有 AI 業(yè)務(wù)嗎?老實(shí)說,這個(gè)還真不一定。我今天仍然很看好的一種技術(shù)是 SQL(結(jié)構(gòu)化查詢語言),這項(xiàng)已有 40 多年歷史的技術(shù)在今天仍然與 1974 年首次出現(xiàn)時(shí)一樣重要。盡管多年來經(jīng)歷了一些改進(jìn),但它仍然像以往一樣強(qiáng)大。

我的整個(gè)職業(yè)生涯都用在了技術(shù)上,我大部分時(shí)間在從事與電子商務(wù)有關(guān)的工作,親眼目睹了這項(xiàng)技術(shù)如何幫助我們發(fā)展業(yè)務(wù)。我們使用這項(xiàng)技術(shù)來提升我們的優(yōu)勢(shì),用它從我們收集的數(shù)據(jù)中找出一些有趣的信息。這些數(shù)據(jù)包含了與消費(fèi)者行為以及他們的購(gòu)物模式和習(xí)慣有關(guān)的信息。我們甚至可以用它預(yù)測(cè)我們應(yīng)該持有或不應(yīng)該持有什么樣的庫(kù)存單位(stock shopping unit,SKU),或者提升客戶滿意度,并讓更多人成為回頭客。接下來,讓我來告訴你我們是如何做到的,或許你也可以。

在與創(chuàng)始人交談時(shí),他們總會(huì)告訴我,他們希望使用 AI/ML 留住客戶和提升終身價(jià)值(Lifetime Value,LTV)。事實(shí)是,他們可能根本不需要使用機(jī)器學(xué)習(xí)或任何那些花哨的技術(shù),正確使用 SQL 才是他們真正需要的。在以前,我使用 SQL 從我們生成的數(shù)據(jù)中提取有價(jià)值的信息和見解。有一次,我們需要知道本周的客戶是誰,因?yàn)槲覀兿胍J(rèn)識(shí)他們,并獎(jiǎng)勵(lì)他們。公司的這種舉動(dòng)通常會(huì)讓顧客感到非常高興,他們因此有可能成為公司忠實(shí)的粉絲。然后我們就會(huì)看到顧客在社交媒體上歡呼他們收到我們的獎(jiǎng)勵(lì)。

事實(shí)證明,這比把錢花在廣告上更有效。不過不要誤會(huì)我的意思,傳統(tǒng)的廣告仍然有它的作用,但沒有什么比值得信賴的朋友的口口相傳更為有效的了。最令人感到驚訝的是,獲取這些信息一點(diǎn)也不困難。除了使用老舊的 SQL 之外,不需要任何其他花哨的技術(shù)。為了獲得本周的客戶,我們寫了一個(gè) SQL 語句來查詢訂單表,在獲得這些信息后,我們通過電子郵件向客戶發(fā)送一封感謝信,并附上一張優(yōu)惠券。你猜怎么了?其中 99%的人成了回頭客。我們從不需要機(jī)器學(xué)習(xí),我們只用了一個(gè)簡(jiǎn)單的 SQL 查詢就獲得了這些信息。

有一次,我們需要與那些暫時(shí)沒有購(gòu)物的顧客重新建立聯(lián)系。我寫了一個(gè) SQL 查詢,收集了最后一次購(gòu)物日期為 3 個(gè)月前的客戶。這個(gè)問題也很簡(jiǎn)單。我寫了一個(gè) SQL 查詢訂單表,把最后一次購(gòu)物日期是 3 個(gè)月前的訂單撈出來。在得到這些信息后,我們會(huì)發(fā)送一封內(nèi)容為“我們想你了,快回來吧,這里附上某某購(gòu)物券”的電子郵件??蛻舻幕貜?fù)率始終大于 50%。同樣的,社交媒體上緊接著就會(huì)出現(xiàn)顧客的歡呼。在我看來,這兩種策略仍然比在谷歌和 Facebook 廣告更有效。

我們將同樣的想法應(yīng)用在推送郵件上。我的意思是,既然可以進(jìn)行個(gè)性化推薦,為什么要向所有人發(fā)送同樣的郵件呢?那么該如何進(jìn)行個(gè)性化推薦?我通過 SQL 檢查購(gòu)物籃中的物品,并將它們逐個(gè)提取出來。然后我們基于這些物品建立創(chuàng)建推送郵件,并加入相關(guān)的內(nèi)容。例如,假設(shè)一個(gè)人買了一雙鞋、一副太陽鏡和一本書,那么在他們的推送郵件中,我們將展示鞋子、太陽鏡和書籍。這比發(fā)送隨機(jī)內(nèi)容更有意義。我的意思是,為什么要給一個(gè)剛買了一雙運(yùn)動(dòng)鞋的男人發(fā)一封內(nèi)容為抽乳器的郵件?它可能毫無意義。大多數(shù)營(yíng)銷電子郵件的打開率為 7-10%。但是,在我們做得好的時(shí)候,這個(gè)數(shù)字可以接近 25%到 30%。

這個(gè)數(shù)字是行業(yè)標(biāo)準(zhǔn)的三倍。我們?cè)谶@些電子郵件中使用了他們的名字作為親切的稱呼,而不只是“親愛的顧客”,這樣充滿了人情味,表示我們對(duì)顧客的關(guān)心。所有這些都是通過老舊的 SQL 而不是花哨的機(jī)器學(xué)習(xí)來實(shí)現(xiàn)的。

對(duì)于因某種原因無法完成訂單的客戶,我們也沒有漏掉他們。只要他們?cè)谫?gòu)物車中添加了商品,就表明他們有購(gòu)買意向。為了讓他們能夠結(jié)賬,我寫了一個(gè) SQL 腳本,并設(shè)置了一個(gè) CRON 作業(yè),向在 48 小時(shí)之前往購(gòu)物車添加過商品的顧客發(fā)送郵件。你猜怎么了?這樣做很有效。因?yàn)槲覀兛梢愿欉@些電子郵件,讓顧客回來繼續(xù)完成訂單。而這個(gè) SQL 查詢也非常簡(jiǎn)單,它選擇了更新時(shí)間大于或等于 48 小時(shí)的非空購(gòu)物車。我們將 CRON 設(shè)置為每天凌晨 2 點(diǎn)運(yùn)行,這個(gè)時(shí)候活動(dòng)和流量較少。然后,客戶在醒來時(shí)收到電子郵件,提醒他們購(gòu)物車?yán)镞€有東西沒結(jié)賬。這里沒什么神奇的東西,只用了 SQL、Bash 和 CRON。

由于貨到付款(Payment On Delivery,POD)算是一件大事情,SQL 再次派上了用場(chǎng)。我們將連續(xù)三次取消訂單的客戶置為高警戒狀態(tài),下次他們?cè)傧掠唵螘r(shí),我們會(huì)打電話給他們,確認(rèn)他們確實(shí)是需要訂單。這樣,我們節(jié)省了時(shí)間,避免了不必要的壓力??偠灾瑢?duì)于這些客戶,我們將對(duì)其禁用 POD,要求他們只能用銀行卡或電子錢包支付。在電子商務(wù)中,物流成本是很高的,所以要把精力集中在信譽(yù)良好的用戶身上。我們不需要機(jī)器學(xué)習(xí)或其他一些花哨的人工智能技術(shù)來解決這個(gè)問題,我們需要的是編寫良好的 SQL。

對(duì)于在 SLA 時(shí)間窗口內(nèi)未能發(fā)貨的訂單,我們也使用 SQL 查詢來管理客戶期望。我們選擇處于未交付狀態(tài)的訂單,比如訂單日期>=7 天,因?yàn)檫@是標(biāo)準(zhǔn)的交付周期。然后我們?cè)O(shè)置 CRON 作業(yè),向客戶發(fā)送電子郵件和短信。雖然顧客沒有立即跳起來為我們鼓掌,但至少,我們向他們保證,我們關(guān)心著他們,并正在努力解決問題。沒有什么比訂單延遲更煩人的了。

這個(gè)特殊的解決方案也對(duì)我們的 NPS 產(chǎn)生了巨大的影響。我們依舊使用老舊的 SQL 和 Bash 解決了我們的難題。

Sift Science 在預(yù)防欺詐方面做得非常出色,但其實(shí) SQL 也可以派上用場(chǎng)。如果一個(gè)人試圖同時(shí)用 3 張不同的卡結(jié)賬,并且這些卡都是空頭,那么就會(huì)發(fā)生一些有趣的事情。我們首先要暫時(shí)阻止他們的賬戶,這樣可以為真正的卡片所有者節(jié)省很多麻煩。我們不需要保存卡片的詳細(xì)信息,只需保存特定訂單號(hào)的結(jié)賬操作,這樣就可以了。這些都不需要使用機(jī)器學(xué)習(xí),只要編寫良好的 SQL 就夠了。

我可能是在說 ML/AI 的壞話。這些技術(shù)有它們的用武之地,亞馬遜已經(jīng)證明了這些技術(shù)的有效性。但是,如果你正在運(yùn)營(yíng)一個(gè)擁有 1,000 到 10,000 個(gè)客戶的小型在線商店,那么完全可以只用 SQL。此外,ML/AI 人才并不好找。

 

原文作者:Celestine Omin

編輯:無明

譯文來源:微信公眾號(hào)“infoQ(ID:infoqchina)”

本文由 @infoQ 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自 Pixabay,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. (1)SQL是機(jī)器學(xué)習(xí)的基礎(chǔ),絕大多數(shù)的機(jī)器學(xué)習(xí)訓(xùn)練數(shù)據(jù)都是需要依賴sql的
    (2)對(duì)于發(fā)放優(yōu)惠券顧客是否會(huì)回頭,這是機(jī)器學(xué)習(xí)中最簡(jiǎn)單的二分類問題。當(dāng)你寫sql導(dǎo)出符合一定條件的用戶出來的時(shí)候,這本身也是一個(gè)學(xué)習(xí)的過程了,根據(jù)你過去的經(jīng)驗(yàn)?zāi)阒朗裁礃拥挠脩羰菚?huì)通過優(yōu)惠券回頭的,這是人腦學(xué)習(xí),而機(jī)器學(xué)習(xí)的目的是不斷提高預(yù)測(cè)精度,找出你通過人腦不能找到的特征
    (3)機(jī)器學(xué)習(xí)遠(yuǎn)遠(yuǎn)不止分類,比如語音轉(zhuǎn)文字、圖片識(shí)別出商品等,如果只把機(jī)器學(xué)習(xí)當(dāng)成一個(gè)分類(顧客是否會(huì)回頭)來看的話,對(duì)機(jī)器學(xué)習(xí)的理解太狹隘了

    作者這篇文章對(duì)機(jī)器學(xué)習(xí)的理解不透徹,觀點(diǎn)不客觀不公正

    來自江蘇 回復(fù)
  2. 產(chǎn)品考慮的還有人工成本等內(nèi)容在里面,拿著新技術(shù)持寵而嬌,泡沫經(jīng)濟(jì),并沒什么意思

    來自北京 回復(fù)
  3. 當(dāng)工業(yè)時(shí)代汽車沒有馬車快時(shí),認(rèn)為汽車是個(gè)沒用的東西。

    來自遼寧 回復(fù)
  4. 科技進(jìn)步就是因?yàn)槭褂眯录夹g(shù),哪怕短時(shí)間內(nèi)新技術(shù)的確不夠舊技術(shù)好用。在技術(shù)實(shí)現(xiàn)層面上的確沒有對(duì)錯(cuò),但你似乎沒太看重技術(shù)的未來

    來自廣東 回復(fù)