信息流推荐多样性
信息流推薦多樣性
一、問題現(xiàn)狀
信息流產(chǎn)品中一個(gè)常見的問題是多樣性越來越差,造成這種問題的原因在于機(jī)器學(xué)習(xí)算法本身。下面通過一副系統(tǒng)循環(huán)圖來介紹多樣性差的問題。
隨著時(shí)間的推移,我們的推薦系統(tǒng)就是娛樂app了,沒有其他類別了。
下圖反映了去看看比例的變化。
6月12號(hào)的資訊曝光分類占比
11月18號(hào)的資訊曝光分類占比
由上圖可以發(fā)現(xiàn),娛樂占比已經(jīng)從6月12日的29%上升到11月18日的45%;女人的占比從6%上升到25%。
二、解決方案
解決方案也很簡單,只要將系統(tǒng)循環(huán)圖中的正反饋切斷或進(jìn)行干擾即可。這里選擇進(jìn)行人工干擾。
為什么選擇在資訊入庫時(shí)進(jìn)行干擾呢?由圖中可以看到,其他推薦給用戶的資訊都是算法根據(jù)用戶興趣進(jìn)行計(jì)算的,進(jìn)行干擾對(duì)用戶體驗(yàn)和用戶使用會(huì)產(chǎn)生較大的影響。資訊入庫這里雖然也會(huì)對(duì)用戶產(chǎn)生影響,但是,相對(duì)于其他途徑影響較小。
具體怎樣進(jìn)行干擾?固定每個(gè)類別的每天資訊入庫比例,按照類別比例進(jìn)行選擇。具體設(shè)置的類別比例如下:
三、多樣性風(fēng)險(xiǎn)和應(yīng)對(duì)策略
3.1 可能的風(fēng)險(xiǎn)
(1)人均閱讀篇數(shù)和人均閱讀時(shí)長下降
多樣性執(zhí)行加入了人工干擾,會(huì)將質(zhì)量較好的娛樂類文章丟棄。預(yù)計(jì)會(huì)對(duì)目前的指標(biāo)有影響,我們將這2個(gè)指標(biāo)控制在下降3%之內(nèi)。同時(shí),資訊庫類別占比達(dá)到預(yù)設(shè)值。
(2)新增用戶對(duì)其他類別不感興趣
多樣性的改觀會(huì)在一定程度上對(duì)新用戶造成影響,如果新用戶群體興趣點(diǎn)只是娛樂,有可能會(huì)導(dǎo)致新用戶轉(zhuǎn)化降低。
(3)短時(shí)間內(nèi)很難選出其他類別的高質(zhì)量文章
短時(shí)間內(nèi),由于曝光不充分,在其他類別資訊選擇上,置信度不是很高。選出的資訊質(zhì)量并不能充分保證,其他類別的效果會(huì)明顯不如娛樂。
3.2 應(yīng)對(duì)策略
針對(duì)以上三種問題,應(yīng)對(duì)策略如下:
(1) 逐步調(diào)整,不會(huì)一步到位,在控制類別比例的過程中,密切關(guān)注數(shù)據(jù)的變化。使得下降的幅度與多樣性修正帶來的好處達(dá)到一個(gè)平衡。
(2) 關(guān)注新用戶的表現(xiàn),新用戶如果是興趣多樣性的用戶,會(huì)提升新用戶的點(diǎn)擊轉(zhuǎn)化。
(3) 隨著時(shí)間的推移,曝光量的增加,其他類別的高質(zhì)量文章選擇將會(huì)越來越精確。
3.3 多樣性評(píng)估
評(píng)估多樣性應(yīng)結(jié)合長期指標(biāo),目前列了如下,后續(xù)將繼續(xù)跟蹤:
四、 計(jì)劃說明
計(jì)劃12月4日與產(chǎn)品達(dá)成一致方案,若未按時(shí)出,則按此方案執(zhí)行。
總結(jié)
- 上一篇: undefined reference
- 下一篇: linux下启动和关闭网卡命令