用“斗渣男”的方法,與低質(zhì)內(nèi)容做斗爭(zhēng)
編輯導(dǎo)讀:對(duì)于內(nèi)容產(chǎn)品來(lái)說(shuō),內(nèi)容審核是必不可少的環(huán)節(jié)之一,特別是針對(duì)低質(zhì)內(nèi)容的篩選和刪改更是勞心勞神。如何快速有效識(shí)別低質(zhì)內(nèi)容,營(yíng)造平臺(tái)良好生態(tài)?本文作者以“斗渣男”的例子,對(duì)此展開(kāi)了分析說(shuō)明,一起來(lái)看看~
直擊靈魂一問(wèn):你遇到過(guò)渣男嗎?
直擊靈魂二問(wèn):你被渣過(guò)嗎?
直擊靈魂三問(wèn):你被渣過(guò)后,怎樣反擊?
要是沒(méi)有,這篇文章就到這兒結(jié)束了?
不!結(jié)束不了!
現(xiàn)在沒(méi)遇到,可以看看渣男的套路,防患于未然。
反渣男套路四部曲:
- 第一步:發(fā)現(xiàn)—透過(guò)蛛絲馬跡,發(fā)現(xiàn)存疑跡象
- 第二步:分析—尋找證據(jù),證明他的身份
- 第三步:識(shí)別—利用確鑿證據(jù),坐實(shí)渣男身份
- 第四步:反擊—多種手段齊上陣,絕地反擊
凈化生態(tài),打擊低質(zhì)內(nèi)容,同樣適用四部曲:
- 第一步:發(fā)現(xiàn)—透過(guò)蛛絲馬跡,發(fā)現(xiàn)疑似低質(zhì)
- 第二步:分析—尋找證據(jù),證明它是低質(zhì)內(nèi)容
- 第三步:識(shí)別—利用模型、人工,精準(zhǔn)識(shí)別低質(zhì)
- 第四步:反擊—降權(quán)、過(guò)濾等手段齊上陣,絕地反擊
一、透過(guò)蛛絲馬跡,尋找證據(jù),揪住低質(zhì)內(nèi)容
我們都知道,世上渣男千千萬(wàn),普遍性中都帶有獨(dú)特性,先來(lái)看看常見(jiàn)的有哪些?那些不常見(jiàn)的,可以通過(guò)什么方法來(lái)發(fā)現(xiàn)?
最常見(jiàn)的就是徒有外表,沒(méi)有內(nèi)涵,利用精致外表來(lái)迷惑人心,讓你放下戒備,徹底淪陷。
另外就是花言巧語(yǔ),利用人性的弱點(diǎn),讓你放下戒備,徹底淪陷。
看到這里,也許你會(huì)反問(wèn)!
- 只要外表光鮮,就是渣男嗎?
- 只要花言巧語(yǔ),就是渣男嗎?
- ……
其實(shí)不然,這些只是列舉的存疑跡象,當(dāng)出現(xiàn)這些跡象后,我們需要小心啦,進(jìn)一步搜集證據(jù),進(jìn)行綜合分析。
- 試探他對(duì)你的各種表達(dá),是否忽冷忽熱?是否行為異常?
- 看他是否向你坦白過(guò)往的歷史,日常所做的事,是否有所隱瞞?
- 看他是否會(huì)把你介紹他的朋友,是否允許你進(jìn)入他的世界,承認(rèn)你的存在?
- 走訪他的周邊朋友,聽(tīng)最“真實(shí)的反饋”
當(dāng)然,要是有最直接的證據(jù),就不用費(fèi)力去做這些了。
比如《三十而已》中,顧佳似乎已經(jīng)通過(guò)許幻山的異常行為發(fā)現(xiàn)了端倪,始終沒(méi)有直接證據(jù)。直到通過(guò)林有有身上的飾品,以及閨蜜拍的照片等直接證據(jù),才坐實(shí)了許幻山出軌的事實(shí)。
……
當(dāng)把這些渣男特征投射到內(nèi)容上,分別對(duì)應(yīng)著標(biāo)題黨與低俗色情內(nèi)容等,這類(lèi)內(nèi)容利用各類(lèi)吸引眼球的關(guān)鍵字,夸大其詞,刺激用戶點(diǎn)擊欲望。利用人性的弱點(diǎn),刺激荷爾蒙分泌,刺激用戶點(diǎn)擊的欲望。
低質(zhì)內(nèi)容特征除了這些之外,還有很多很多,隨著自媒體的發(fā)展,自媒體創(chuàng)作者發(fā)揮著無(wú)窮無(wú)盡的“聰明才智”獲取流量。
對(duì)于可枚舉低質(zhì)內(nèi)容,按照不同內(nèi)容體裁可有以下枚舉值:
對(duì)于不可枚舉低質(zhì)內(nèi)容,沒(méi)法通過(guò)模型或者人工立馬將其干掉,但可通過(guò)一些蛛絲馬跡,將其揪出重點(diǎn)監(jiān)控與分析。
1. 用戶反饋-最真實(shí)的聲音
內(nèi)容類(lèi)產(chǎn)品都有設(shè)置用戶反饋渠道,除了固定反饋選項(xiàng),用戶也可主動(dòng)填寫(xiě)意見(jiàn)建議,那么應(yīng)該怎樣用好這些資源?
A)搭建數(shù)據(jù)監(jiān)控報(bào)表,針對(duì)每一類(lèi)負(fù)反饋選項(xiàng),整體負(fù)反饋投訴等,監(jiān)測(cè)小時(shí)級(jí)、天級(jí)的用戶反饋趨勢(shì)變化,定期進(jìn)行分析。建立報(bào)警機(jī)制,當(dāng)某類(lèi)投訴超出一定閾值(比如xx小時(shí)內(nèi)投訴內(nèi)容猛增xxx+),發(fā)出報(bào)警信息,重點(diǎn)排查監(jiān)控。
B)定期分析用戶主動(dòng)填寫(xiě)的意見(jiàn)反饋,除了人工一條條查閱總結(jié),也可通過(guò)python切詞進(jìn)行詞頻分析,統(tǒng)計(jì)用戶負(fù)向反饋集中于哪些方向。筆者拉出了所在公司一定時(shí)間周期內(nèi)用戶負(fù)反饋數(shù)據(jù),用python切詞處理得到如下結(jié)果:
通過(guò)詞頻統(tǒng)計(jì)發(fā)現(xiàn),用戶反饋比較高頻的詞語(yǔ)基本沒(méi)什么實(shí)際意義,但也不乏“胡說(shuō)八道”“廢話”等反應(yīng)用戶情緒的詞語(yǔ),再聯(lián)系情景語(yǔ)境與被反饋的文章內(nèi)容,也可總結(jié)出一批低質(zhì)內(nèi)容特征(慢工出細(xì)活,這里需要很強(qiáng)的總結(jié)歸納能力)。
附上python切詞代碼,墻裂推薦超好用的一款工具-VS code。
import jieba
txt=open(“d:\負(fù)反饋內(nèi)容.txt”,”r”,encoding=’utf-8′).read()
words=jieba.lcut(txt)
counts={}
forwordinwords:
iflen(word)==1:
continue
else:
counts[word]=counts.get(word,0)+1
items=list(counts.items())
items.sort(key=lambdax:x[1],reverse=True)
foriinrange(1000):
word,count=items[i]
print(“{0:<5}{1:>5}”.format(word,count))
2. 審核當(dāng)好把門(mén)關(guān)
隨著自媒體時(shí)代到來(lái),人人都是發(fā)聲者,每日海量?jī)?nèi)容涌入各大平臺(tái),內(nèi)容安全變得越來(lái)越重要。機(jī)器模型無(wú)法做到100%準(zhǔn)確識(shí)別,人工的力量變的愈發(fā)重要。
眾所周知,審核同學(xué)會(huì)在審核時(shí)為內(nèi)容打標(biāo)(主要針對(duì)既有的枚舉低質(zhì)內(nèi)容標(biāo)簽),業(yè)界常規(guī)做法是利用機(jī)器模型輔助人審,提升審核效率。
無(wú)法枚舉的低質(zhì)內(nèi)容,該怎樣發(fā)現(xiàn),監(jiān)控爆發(fā)增長(zhǎng)趨勢(shì)?
此刻,搭建一套監(jiān)控機(jī)制體系顯得尤為重要!
第一步:審核工具增加“疑似低質(zhì)”tag選項(xiàng),標(biāo)識(shí)沒(méi)有被既有低質(zhì)標(biāo)簽覆蓋的內(nèi)容。
注意點(diǎn):加強(qiáng)審核人員培訓(xùn),包括內(nèi)容審核標(biāo)準(zhǔn)培訓(xùn)(了解實(shí)際工作,提升專(zhuān)業(yè)能力)、業(yè)務(wù)培訓(xùn)(拓展知識(shí)邊界,加深業(yè)務(wù)理解)等,只有審核同學(xué)更了解業(yè)務(wù),才能在審核打標(biāo)時(shí)理解更透徹。
第二步:建立監(jiān)控報(bào)表,針對(duì)每一類(lèi)既有低質(zhì)內(nèi)容,疑似低質(zhì)內(nèi)容等,監(jiān)測(cè)這些標(biāo)簽內(nèi)容在不同類(lèi)目、不同時(shí)段的數(shù)量變化趨勢(shì),對(duì)于一定周期內(nèi)爆發(fā)式增長(zhǎng)、某個(gè)類(lèi)目爆發(fā)式增長(zhǎng)的低質(zhì)內(nèi)容,重點(diǎn)監(jiān)控與排查分析。
第三步:定期分析疑似低質(zhì)內(nèi)容,從中總結(jié)歸納新的低質(zhì)內(nèi)容,建立模型標(biāo)準(zhǔn),推進(jìn)樣本標(biāo)注與模型訓(xùn)練,輸出滿足上線要求的內(nèi)容質(zhì)量模型,輔助人審或者應(yīng)用線上。
二、精準(zhǔn)識(shí)別低質(zhì)內(nèi)容,絕地反擊
我們透過(guò)蛛絲馬跡,發(fā)現(xiàn)了渣男的可疑跡象,通過(guò)各種方法搜集到證據(jù),怎樣讓他現(xiàn)出原形?
- 當(dāng)面對(duì)質(zhì)
- 將他說(shuō)的假話念給他聽(tīng)
- 將隱瞞的種種事實(shí)說(shuō)給他聽(tīng)
- 將朋友的真實(shí)反饋說(shuō)給他聽(tīng)
- 將最直接的證據(jù)扔他臉上
- ……
如果
渣男,鑒定無(wú)疑,怎么處理?
當(dāng)然,一腳把它踢開(kāi)呀!
那么,通過(guò)模型、人審精準(zhǔn)識(shí)別的低質(zhì)內(nèi)容,應(yīng)該怎樣處理?
想要回答這個(gè)問(wèn)題,首先我們來(lái)看看推薦系統(tǒng)怎樣運(yùn)轉(zhuǎn)。
推薦系統(tǒng)大致分為5個(gè)環(huán)節(jié):推薦內(nèi)容候選池(正排)→召回→粗排→精排→機(jī)制策略
- 推薦內(nèi)容候選池:從內(nèi)容庫(kù)中通過(guò)一定過(guò)濾條件,篩選可用內(nèi)容。
- 召回:從推薦內(nèi)容候選池中,通過(guò)一定規(guī)則(內(nèi)容特征特征、模型、功能等)找到對(duì)應(yīng)內(nèi)容。
- 粗排:針對(duì)各路召回內(nèi)容,利用用戶特征、內(nèi)容特征、環(huán)境特征、交叉特征等進(jìn)行粗粒度排序。
- 精排:再次利用精細(xì)化特征信息,利用cyr預(yù)估等模型,為內(nèi)容打分排序,產(chǎn)生一個(gè)用戶的待推薦內(nèi)容列表。
- 機(jī)制策略:使用各種機(jī)制策略(打散、去重、提權(quán)、過(guò)濾等)得到用戶最終推薦內(nèi)容列表。
由此來(lái)看,處理低質(zhì)內(nèi)容可作用于召回、機(jī)制策略等環(huán)節(jié)。
1. 作用于召回-召回過(guò)濾
適用范圍:嚴(yán)重影響用戶閱讀體驗(yàn)的強(qiáng)低質(zhì)內(nèi)容,比如視頻無(wú)聲音、模糊、音畫(huà)不同步等。
實(shí)現(xiàn)形式:直接將命中的tag內(nèi)容過(guò)濾掉,不會(huì)進(jìn)入排序環(huán)節(jié)。
2. 作用于機(jī)制策略-推薦降權(quán)
適用范圍:不嚴(yán)重影響用戶閱讀體驗(yàn),比如標(biāo)題黨、低俗等內(nèi)容。
實(shí)現(xiàn)形式:
1)機(jī)制策略側(cè)加上降權(quán)邏輯,降低此類(lèi)內(nèi)容在推薦列表排序,從而減小曝光量。
注意點(diǎn):對(duì)于標(biāo)題黨、低俗等內(nèi)容打壓,勢(shì)必會(huì)對(duì)大盤(pán)數(shù)據(jù)造成影響,因此需要AB實(shí)驗(yàn)驗(yàn)證打壓策略的實(shí)際效果。
- AB實(shí)驗(yàn)隨機(jī)分桶,進(jìn)行小流量實(shí)驗(yàn)
- 關(guān)注核心數(shù)據(jù)指標(biāo):人均人均點(diǎn)擊、人均閱讀時(shí)長(zhǎng)、次日留存、3日留存等。
- 若實(shí)驗(yàn)收益負(fù)向,觀察核心指標(biāo)浮動(dòng)區(qū)間是否穩(wěn)定,找到平衡點(diǎn),再上報(bào)領(lǐng)導(dǎo)層,對(duì)于實(shí)驗(yàn)的負(fù)向收益區(qū)間是否可接受。若可接受,可分階段擴(kuò)大流量上線。若不可接受,需要調(diào)整策略(建立低質(zhì)內(nèi)容分檔分級(jí),由嚴(yán)重到一般分級(jí)打壓,給用戶適應(yīng)周期)。
2)搭建一套生態(tài)凈化平臺(tái)工具,靈活管控內(nèi)容生態(tài)
生態(tài)凈化工具可大致分為三個(gè)模塊:模型內(nèi)容特征參數(shù)配置→凈化過(guò)濾任務(wù)配置→生效范圍配置
- 模型內(nèi)容特征參數(shù)配置:可實(shí)現(xiàn)對(duì)不同模型內(nèi)容特征設(shè)定閾值,卡檔分級(jí),根據(jù)模型迭代優(yōu)化效果,靈活調(diào)整參數(shù)配置??芍С蛛S時(shí)增添新模型內(nèi)容特征配置。
- 凈化過(guò)濾任務(wù)配置:針對(duì)圖文/視頻/小視頻等不同體裁分別配置過(guò)濾任務(wù),可從一二級(jí)分類(lèi)、標(biāo)題關(guān)鍵字、內(nèi)容屬性特征(模型特征+人審標(biāo)簽)等維度進(jìn)行配置??芍С蛛S時(shí)添加新模型特征與人審標(biāo)簽。
- 生效范圍配置:針對(duì)配置好的凈化過(guò)濾任務(wù),再次配置生效范圍,可從用戶性別與年齡,地域、手機(jī)型號(hào)與系統(tǒng)、bucket(流量分桶)等進(jìn)行生效用戶圈定。可支持隨時(shí)添加新的特征字段。
通過(guò)生態(tài)凈化工具,靈活管控,在重大節(jié)日、特殊時(shí)期等節(jié)點(diǎn),可實(shí)現(xiàn)快速、靈活響應(yīng)。
渣男千千萬(wàn),永遠(yuǎn)斗不完。
低質(zhì)內(nèi)容萬(wàn)萬(wàn)種,永遠(yuǎn)打不完。
對(duì)待渣男,要擦亮雙眼,不要沉迷!
對(duì)待低質(zhì)內(nèi)容,要擦亮雙眼,不放過(guò)一個(gè)!
這場(chǎng)戰(zhàn)役,將是場(chǎng)持久戰(zhàn)!
本文由 @珂然 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議
確實(shí)是個(gè)持久戰(zhàn),敵進(jìn)我退,敵駐我擾,敵疲我打,敵退我追。