策略產(chǎn)品經(jīng)理子方向:搜索策略產(chǎn)品
搜索策略產(chǎn)品的工作可能會遇到哪些場景和流程?這篇文章里,作者基于工作中的搜索項(xiàng)目,從5個主要問題出發(fā)做了拓展和闡述,一起來看看吧。
基于工作中的搜索項(xiàng)目,進(jìn)行相關(guān)搜索策略產(chǎn)品工作的總結(jié),本文主要匯總了以下5個問題進(jìn)行拓展敘述:
- 搜索場景主要模塊
- 搜索場景常見名詞解釋
- 搜索場景核心流程
- 優(yōu)化目標(biāo)的制定
- 搜索場景需要建設(shè)及優(yōu)化方向
一、搜索場景主要模塊
市面上常見的產(chǎn)品,搜索場景基本上都是由搜索入口、搜索中間頁、搜索結(jié)果頁這三部分組成,如下:
- 搜索入口:搜索框+底紋詞(搜索框自帶的推薦詞)
- 搜索中間頁:歷史搜索、熱門搜索/搜索發(fā)現(xiàn)、聯(lián)想詞、主動搜索、中間頁搜索榜單(或運(yùn)營banner)
- 搜索結(jié)果頁:搜索結(jié)果頁feed流、排序/篩選功能模塊、廣告位、運(yùn)營位/banner
各產(chǎn)品細(xì)拆下來還有很多模塊,雖然模塊較多,但這些模塊存在的核心目標(biāo)都是為了讓用戶在搜索場景快速找到精確目標(biāo)內(nèi)容,提升轉(zhuǎn)化和用戶體驗(yàn)。
二、搜索場景常見名詞解釋
1. query
query即用戶搜索詞,在眾多模塊中,搜索詞可能是用戶主動輸入的,也可能是點(diǎn)擊歷史搜索詞/熱門搜索詞/聯(lián)想詞/底紋詞等等跳轉(zhuǎn)搜索結(jié)果頁的內(nèi)容,也都算作搜索詞,也叫關(guān)鍵詞。
2. 相關(guān)性
相關(guān)性是用戶搜索詞與搜索頁面內(nèi)容的相關(guān)程度,比較簡單場景的是從用戶畫像和內(nèi)容文本的相關(guān)性去衡量相關(guān)性。大概的做法是隨機(jī)抽取一部分用戶的搜索詞及對應(yīng)的搜索結(jié)果內(nèi)容,拿用戶畫像中的部分畫像字段,再拿搜索結(jié)果的物品的相關(guān)字段,人工定義2邊的字段內(nèi)容是否相關(guān)以及相關(guān)性強(qiáng)度等。
3. 索引&倒排索引
1)索引
索引是一種像書籍目錄一樣快速查詢數(shù)據(jù)的結(jié)構(gòu),能夠快速定位和查找數(shù)據(jù)。索引能夠?qū)⒉樵儾僮鞯臅r間復(fù)雜度從遍歷整個文檔集合降低到對索引的查詢,大大提升效率。
2)倒排索引
倒排索引是搜索引擎中最常用的索引結(jié)構(gòu)之一,尤其適用于文本檢索場景。其工作原理主要包括以下步驟:
- 文檔分詞:首先,對每一個文檔(如職位描述或簡歷)進(jìn)行分詞處理,將文本分割成單個單詞或短語,稱為“詞元”。這個過程可能包括去除停用詞(如“的”、“和”等)、詞形還原(將單詞變?yōu)槠湓危纭皉unning”變?yōu)椤皉un”)等。
- 詞項(xiàng)記錄:為每一個獨(dú)特的詞元創(chuàng)建一個項(xiàng)記錄,這個記錄包含該詞出現(xiàn)的所有文檔ID列表及其在文檔中的位置信息。這是倒排索引的精髓,它把“詞”到“文檔”的映射關(guān)系反轉(zhuǎn)過來,就是倒排。
- 壓縮與優(yōu)化:為了節(jié)省空間和提高效率,會對這些記錄進(jìn)行壓縮和索引結(jié)構(gòu)的優(yōu)化,如使用位圖、倒排列表等數(shù)據(jù)結(jié)構(gòu)。
*以招聘場景舉例說明倒排索引的應(yīng)用:求職者搜索特定職位時,系統(tǒng)只需要在倒排索引中查找關(guān)鍵詞對應(yīng)的文檔ID列表,即可快速找到匹配的職位,無需掃描全部職位信息。
4. 意圖識別
1)意圖識別
我個人認(rèn)為,意圖識別就是在技術(shù)上區(qū)分搜索和推薦的核心不同點(diǎn)之一。當(dāng)用戶在搜索場景中輸入關(guān)鍵詞詞(query)時,系統(tǒng)會對關(guān)鍵詞進(jìn)行“分詞-糾錯-改寫-意圖識別-輸出識別結(jié)果”這一系列操作,我們把這個過程統(tǒng)稱為意圖識別。
例如,在招聘平臺中,意圖識別意味著理解求職者是尋找特定職位、公司信息、工作場所、薪資還是其他相關(guān)內(nèi)容,基本知道了用戶在搜什么,然后根據(jù)這個意圖去推薦符合意圖的崗位。這里存放內(nèi)容信息的地方,就叫做索引。
2)分詞
分詞又叫切詞,是文本處理中的基礎(chǔ)步驟,切詞對于提高搜索效率和準(zhǔn)確率非常重要。切詞是將連續(xù)的文本分割成獨(dú)立且有語義的詞,這也是切詞的難點(diǎn):識別詞的邊界和歧義問題。
切詞時先對文本進(jìn)行臟數(shù)據(jù)清洗和轉(zhuǎn)化(去除標(biāo)點(diǎn)、大小寫轉(zhuǎn)換等),然后用平臺自有或市面上場景的詞典進(jìn)行文本匹配切詞,匹配成功就切詞。這里面涉及到詞典中沒有的和有歧義的詞,需要進(jìn)行算法切分或進(jìn)行詞性標(biāo)注進(jìn)行劃分,優(yōu)化詞典。
3)糾錯
糾錯是提升用戶體驗(yàn)和搜索效率的重要部分,尤其是在處理用戶輸入的關(guān)鍵詞時,能夠有效的識別就糾錯,確保用戶能夠快速找到需要的內(nèi)容。
常見的糾錯內(nèi)容有:拼寫糾錯、語法糾錯、同音詞糾錯、縮寫糾錯等。在用戶輸入搜索詞后,進(jìn)行初步處理(去掉空格、標(biāo)點(diǎn)等)后,利用詞典(專業(yè)詞庫或錯誤詞典)對每個詞進(jìn)行匹配,且考慮關(guān)鍵詞的上下文信息,進(jìn)行糾錯推斷。還能利用模型算法進(jìn)行糾錯。通過自動糾錯的方式,提升搜索效率及搜索場景的包容性,進(jìn)一步提升用戶體驗(yàn)。
4)改寫
改寫是提升搜索質(zhì)量和用戶體驗(yàn)的關(guān)鍵過程之一。改寫通過分析理解用戶的關(guān)鍵詞,進(jìn)行轉(zhuǎn)換,生成更精準(zhǔn)更符合自己平臺的查詢query,從而獲得更準(zhǔn)更多的搜索結(jié)果。
改寫通過同義詞替換、拼寫修正、短語識別與重組、去噪化數(shù)據(jù)、規(guī)范化數(shù)據(jù)等方面進(jìn)行搜索詞處理。在用戶輸入搜索詞后,進(jìn)行初步的分詞和去噪處理(去掉無意義詞),通過自然語言處理技術(shù)分析用戶查詢的意圖,包括關(guān)鍵詞分析、上下文理解等。根據(jù)已建立的改寫規(guī)則庫(如同義詞表、拼寫糾正規(guī)則等),匹配合適的改寫方案。運(yùn)用機(jī)器學(xué)習(xí)模型,基于用戶行為數(shù)據(jù)和歷史搜索結(jié)果,動態(tài)生成更精準(zhǔn)的改寫建議。
改寫能提升搜索結(jié)果相關(guān)性,有效處理長尾查詢,拓寬用戶搜索范圍,增加內(nèi)容覆蓋度,促進(jìn)長尾流量的轉(zhuǎn)化。
*意圖識別引導(dǎo)整個搜索過程,決定是否需要改寫;改寫優(yōu)化查詢以提高相關(guān)性;切詞和分詞提供基本處理單元;詞典和詞庫提供詞匯規(guī)范和專業(yè)匹配依據(jù),共同確保搜索的高效和準(zhǔn)確。
三、搜索場景核心流程
關(guān)于搜索場景的召回、排序等介紹,大家感興趣的可以看之前的介紹:http://22none.com/pd/4519608.html
四、制定搜索場景優(yōu)化目標(biāo)
1. 定義搜索場景及用戶需求
1)用戶群體:需要明確平臺的主要用戶群體,如求職者、雇主客戶、代招(獵頭)等,并分析他們的特定需求。
2)搜索場景:識別用戶在什么情境下使用搜索功能,如求職者尋找特定職位、雇主客戶篩選候選人、獵頭尋求合適人才等。
2. 確定優(yōu)化目標(biāo)
其實(shí)在第二部分中就已經(jīng)提到了搜索場景中各模塊的核心目標(biāo):讓用戶在搜索場景快速找到精確目標(biāo)內(nèi)容,提升轉(zhuǎn)化和用戶體驗(yàn)。因此,搜索場景的整體優(yōu)化目標(biāo),其實(shí)就是快速識別用戶意圖、進(jìn)行精準(zhǔn)推薦,并讓用戶快速完成轉(zhuǎn)化。
- 提升用戶體驗(yàn):減少搜索響應(yīng)時間,優(yōu)化搜索結(jié)果的相關(guān)性和多樣性,提供個性化推薦。
- 增加用戶參與度:提升搜索后的行為轉(zhuǎn)化率(如點(diǎn)擊、申請職位、收藏、投遞簡歷等),延長用戶在平臺的停留時間。
- 業(yè)務(wù)目標(biāo):提高職位匹配效率,增加有效連接(求職者與雇主的配對),提升用戶滿意度和留存率,最終推動業(yè)務(wù)增長。
3. 設(shè)定目標(biāo)提升量
根據(jù)核心目標(biāo),我們制定了對應(yīng)的量化指標(biāo):各公司的優(yōu)化方向略有差異,但整體思路大同小異,搜索場景的優(yōu)化目標(biāo)對比下來,基本上是以下4個方向指標(biāo)的提升:內(nèi)容的相關(guān)性提升、轉(zhuǎn)化漏斗中轉(zhuǎn)化指標(biāo)的提升(ctr-點(diǎn)擊率、cvr-轉(zhuǎn)化率、deep-cvr深度轉(zhuǎn)化等)、轉(zhuǎn)化數(shù)量絕對值的提升、用戶滿意度;
量化指標(biāo)的確定以后,需要確定量化目標(biāo)值,例如轉(zhuǎn)化量提升10%。這個10%是怎么來的?不能摸著腦袋直接拍數(shù)據(jù),需要多角度進(jìn)行合理預(yù)估:
- 基準(zhǔn)線分析:當(dāng)前搜索場景的用戶量、轉(zhuǎn)化率、轉(zhuǎn)化量數(shù)據(jù);對比各周期數(shù)據(jù)漲幅趨勢;
- 上限預(yù)估:根據(jù)競品分析、平臺往年數(shù)據(jù)對比、轉(zhuǎn)化漏斗拆分,預(yù)估用戶量上限和轉(zhuǎn)化指標(biāo)上限;
- 快速驗(yàn)證:在正式實(shí)施前,通過A/B測試或小范圍試驗(yàn)新策略,收集數(shù)據(jù)以量化預(yù)期提升效果。
- 風(fēng)險評估:評估實(shí)施計劃所需的時間、人力、技術(shù)資源以及潛在風(fēng)險,確保目標(biāo)設(shè)定在資源可承受范圍內(nèi),同時考慮到可能遇到的阻力和不確定性。
*最近預(yù)估的10%轉(zhuǎn)化率提升是基于上述多維度分析的結(jié)果,是一個結(jié)合了歷史數(shù)據(jù)、行業(yè)標(biāo)準(zhǔn)、技術(shù)可行性及資源評估的綜合預(yù)判。實(shí)際操作中,這一目標(biāo)應(yīng)當(dāng)是靈活調(diào)整的,并隨著項(xiàng)目進(jìn)展不斷校驗(yàn)和優(yōu)化。
五、搜索優(yōu)化方向
優(yōu)化目標(biāo)相關(guān)指標(biāo)思考清楚后,整個場景的優(yōu)化目標(biāo)值就很清晰了,這部分主要根據(jù)我在工作中遇到的問題匯總后劃分了以下4個方向去優(yōu)化:
1. 用戶覆蓋率(c端產(chǎn)品體驗(yàn)+策略優(yōu)化)
這部分主要是針對功能模塊的優(yōu)化,去合理提升用戶在各模塊的覆蓋率以及用戶在搜索場景的轉(zhuǎn)化路徑;
需要看的數(shù)據(jù)主要有:
1)整個轉(zhuǎn)化流程中用戶的轉(zhuǎn)化漏斗(請求-下發(fā)-曝光-點(diǎn)擊-轉(zhuǎn)化-深度轉(zhuǎn)化),去看用戶在哪一塊的流失率最高,進(jìn)行歸因分析
2)提升點(diǎn)擊數(shù)量常用的策略:擴(kuò)大曝光量及吸引用戶眼球(加角標(biāo)或創(chuàng)意提示)
3)去掉多余的功能及轉(zhuǎn)化路徑(差異化推薦)
從用戶點(diǎn)擊搜索框-歷史搜索詞/熱門搜索列表-聯(lián)想詞-搜索結(jié)果頁/結(jié)果頁的結(jié)構(gòu)組成/展現(xiàn)形式等,進(jìn)行體驗(yàn)端問題匯總,以優(yōu)化核心價值為目標(biāo),去做匯總;
2. 檢索流程及背后邏輯
匯總搜索場景線上流程并梳理對應(yīng)的檢索邏輯,如上面第二節(jié)講的搜索場景核心流程,根據(jù)核心流程拆分成以下優(yōu)化邏輯:
1)用戶點(diǎn)擊搜索框-點(diǎn)擊歷史搜索/點(diǎn)擊搜索按鈕/點(diǎn)擊熱門搜索/點(diǎn)擊聯(lián)想詞-請求列表頁(召回-排序-打散)
2)明確搜索場景目前線上檢索流程及對應(yīng)的背后邏輯,梳理完后,針對不同流程的邏輯進(jìn)行優(yōu)化,對接不同的技術(shù)團(tuán)隊
3)從整體體驗(yàn)端流程(用戶點(diǎn)擊搜索框–>用戶在搜索場景完成深度轉(zhuǎn)化)的每一個階段,對應(yīng)到底層的邏輯鏈路,去做相應(yīng)的梳理和建設(shè),整體的流程按照串聯(lián)點(diǎn)去做;
3. 內(nèi)容優(yōu)化
相關(guān)內(nèi)容體驗(yàn)及線上客訴融合,針對內(nèi)容出不來、出來的內(nèi)容不合理、內(nèi)容排序排不出上去、無法精準(zhǔn)搜索等問題,細(xì)化挖掘底層原因,進(jìn)行優(yōu)化方案輸出;
*我在工作中常見的底層原因主要是意圖識別不準(zhǔn)確、分詞過細(xì)、標(biāo)簽召回有誤等,供參考。
4. 數(shù)據(jù)側(cè)要點(diǎn)
數(shù)據(jù)完整度決定了場景優(yōu)化的上限,在搜索場景優(yōu)化或正常的策略優(yōu)化中,都需要優(yōu)先做數(shù)據(jù)測算,以下是我在搜索場景優(yōu)化中匯總的數(shù)據(jù)側(cè)需要注意的地方:
1)埋點(diǎn)梳理
- 搜索場景常見指標(biāo)是否有對應(yīng)的埋點(diǎn)或日志表數(shù)據(jù)
- 轉(zhuǎn)化漏斗數(shù)據(jù)鏈路是否完整
2)數(shù)據(jù)看板
- 整體轉(zhuǎn)化漏斗看板/分請求來源看轉(zhuǎn)化漏斗看板
- 人均指標(biāo)看版
3)搜索詞監(jiān)控
- 針對頭部搜索詞對比,檢測頭部搜索詞是否異常,以及當(dāng)天新出現(xiàn)在頭部的搜索詞(及昨天對應(yīng)為top位置)
- 搜索詞接信安、風(fēng)控等過濾接口
4)優(yōu)化路徑匯總
數(shù)據(jù)摸底,輸出結(jié)論及問題規(guī)劃。
前期需要對現(xiàn)有搜索場景進(jìn)行快速的數(shù)據(jù)摸底工作,從數(shù)據(jù)維度確認(rèn)gap在哪,主要有以下幾個維度的數(shù)據(jù)摸底:
場景與大盤數(shù)據(jù):
- 場景流量數(shù)據(jù)
- 分流程uv/pv轉(zhuǎn)化率
- 留存數(shù)據(jù)(對比大盤)
場景頁面轉(zhuǎn)化數(shù)據(jù):
- 轉(zhuǎn)化率
- 分位置轉(zhuǎn)化數(shù)據(jù)
頭部搜索詞數(shù)據(jù):
- top1000/3000/5000/N搜索詞曝光占比
- 天/周/月搜索詞重合度
- 高曝光高轉(zhuǎn)化搜索詞
- 高曝光低轉(zhuǎn)化搜索詞
長短期搜索詞監(jiān)測和數(shù)據(jù)看板建設(shè);
搜索詞監(jiān)測:
- 搜索場景核心指標(biāo)監(jiān)測
- 突發(fā)熱詞監(jiān)測
- 頭部熱詞轉(zhuǎn)化率監(jiān)測(高曝光高轉(zhuǎn)化/高曝光低轉(zhuǎn)化,出發(fā)預(yù)警)
數(shù)據(jù)看板:
- 整體轉(zhuǎn)化漏斗
- 分召回策略轉(zhuǎn)化漏斗
六、其他關(guān)注點(diǎn)
1. 優(yōu)化前對齊搜索場景項(xiàng)目優(yōu)化目標(biāo)及限制條件(商業(yè)收入與連接量的平衡點(diǎn))或其他訴求(商業(yè)流量占比與商業(yè)收入的關(guān)系)。
2. 明確各流程/各部門接口人,避免單個部分多人來回溝通;需求溝通明確時間節(jié)點(diǎn)。
3. 以項(xiàng)目形式進(jìn)行推進(jìn),避免單個需求來回溝通,浪費(fèi)技術(shù)資源。
4. 數(shù)據(jù)先行,埋點(diǎn)的制定及ab分流的策略等。
5. 抓住重點(diǎn),看數(shù)據(jù)在核心不在多,不能哐一下搞一堆數(shù)據(jù)出來,沒有核心點(diǎn)。
本文由 @大俗大雅 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

很棒的文章 受益匪淺
為什么好久沒看到你更新了呀
感謝前輩指點(diǎn)!幫大忙了
寫的很細(xì)致,基本與我現(xiàn)在的工作一致。