手淘促活那些事儿 | 智能投放算法框架助力用户增长
導(dǎo)讀:本文主要介紹以手淘促活為目的的全鏈路智能投放算法框架,該框架目前接入以 Pagani 為核心的全鏈路運營平臺,首先使用用戶意圖識別算法圈選出目標(biāo)人群,然后借助物料智能推薦和權(quán)益動態(tài)面額等算法實現(xiàn)全鏈路上用戶的個性化觸達(dá)干預(yù)。本文以 2019 年春節(jié)期間手淘促活項目為例,具體地介紹權(quán)益智能投放框架的設(shè)計思路和實際應(yīng)用。
一、背景:春節(jié)手淘促活
由于快遞物流、商家打烊等因素,春節(jié)是電商的淡季。對于手淘來說,在春節(jié)期間,用戶的活躍程度有明顯的下滑, DAU 出現(xiàn)一段時間的低谷。通過算法提前預(yù)測春節(jié)期間活躍度會發(fā)生下降的預(yù)警人群,配合不同階段的用戶運營干預(yù)(在節(jié)前預(yù)熱期結(jié)合春節(jié)“吃喝玩樂”的場景,算法個性化推薦相應(yīng)的虛擬權(quán)益;春節(jié)期間通過 PUSH 消息每日推送提升來訪率),可以有效地促進(jìn)用戶回訪、扼制用戶活躍度的降低。
如圖,通過對近兩年春節(jié)前后的 DAU 的變化趨勢進(jìn)行統(tǒng)計分析,我們發(fā)現(xiàn),春節(jié)對 DAU 的影響持續(xù)以除夕為中心的近一個月的時間(從臘月十六到正月十五左右),而傳統(tǒng)春節(jié)放假的 7 天是 DAU 的最低谷( 18 年除夕晚有春晚紅包加持除外)。
根據(jù)以上分析結(jié)果,可定義出模型預(yù)測的關(guān)鍵的時間節(jié)點。在節(jié)前,通過算法預(yù)測,從臘月十六到正月十五的春節(jié)30天期間,活躍度會發(fā)生下降的“降級預(yù)警人群”,在整個活動期對“降級預(yù)警人群”進(jìn)行有針對性的用戶運營干預(yù),而在進(jìn)行干預(yù)時,又可以通過推薦算法,結(jié)合用戶的意圖識別,進(jìn)行權(quán)益的個性化承接。
二、全鏈路智能投放算法框架
?
如圖所示,權(quán)益智能投放算法框架,主要包括意圖識別、權(quán)益推薦兩個功能模塊:
意圖識別:
解決“是否發(fā)”的問題,側(cè)重點在于“圈人”,給什么樣的用戶發(fā)放權(quán)益;
對于春節(jié)促活項目的具體訴求,通過用戶的來訪意圖模型,提前預(yù)測無來訪的用戶,在站內(nèi)通過支付成功頁等場景的權(quán)益觸達(dá)提前干預(yù),站外通過PUSH消息等渠道進(jìn)行權(quán)益觸達(dá)和召回。
權(quán)益推薦:
解決“發(fā)什么”的問題,給用戶發(fā)放什么樣的權(quán)益;
拿到圈選的人群后,需要對人進(jìn)行“千人千面”的權(quán)益?zhèn)€性化承接。
三、算法模塊
3.1 意圖識別
意圖識別,根據(jù)用戶畫像和歷史行為,預(yù)測用戶未來某一時間段內(nèi)、某種行為(如用戶的來訪、點擊、收藏、加購、購買等)的發(fā)生的概率。
對于用戶增長來說,大部分情況下,運營的干預(yù)目標(biāo)往往不是單一的,而是“既要、又要、還要、也要“的。對于運營的一個干預(yù)策略,目標(biāo)是多樣性的,需要考慮來訪率、次日留存率、瀏覽轉(zhuǎn)化率、成交轉(zhuǎn)化率、ROI等不同的目標(biāo)如何權(quán)衡和綜合優(yōu)化。
針對不同的干預(yù)目標(biāo),構(gòu)造樣本數(shù)據(jù)和搭建多意圖的訓(xùn)練體系:
LABEL選取和樣本構(gòu)造:
根據(jù)不同的優(yōu)化目標(biāo),加工數(shù)據(jù),選用不用的LABEL和抽取樣本,如領(lǐng)取率LABEL對應(yīng)權(quán)益是否領(lǐng)取,核銷率LABEL對應(yīng)權(quán)益是否核銷,成交轉(zhuǎn)化率對應(yīng)用戶是否有下單支付等;
用戶意圖體系構(gòu)建:
訓(xùn)練用戶來訪、點擊、收藏、加購、購買等不同的意圖評分模型;
**意圖模型日常評估:
**
- 用戶購買意圖:AUC = 0.83,F1 score = 0.76
- 用戶來訪意圖:AUC = 0.86,F1 score = 0.78
- 用戶點擊意圖:AUC = 0.76,F1 score = 0.88
- 用戶加購意圖:AUC = 0.80,F1 score = 0.64
- 用戶收藏意圖:AUC = 0.88,F1 score = 0.58
具體到春節(jié)用戶無來訪的預(yù)測問題來說,核心就是用戶來訪意圖的預(yù)測。以 2017 年春節(jié)期的數(shù)據(jù)作為訓(xùn)練集, 2018 年春節(jié)期的數(shù)據(jù)作為測試集,評估數(shù)據(jù)如下:
?
3.2 權(quán)益推薦
權(quán)益推薦,解決用戶的權(quán)益?zhèn)€性化承接的問題,綜合考慮用戶的權(quán)益偏好和敏感度、各類權(quán)益的目標(biāo)人群和庫存量、平臺的補貼成本等,實現(xiàn)用戶、商家、平臺的三方共贏。
手淘春節(jié)促活項目,是全鏈路智能投放框架首次應(yīng)用于購后發(fā)放權(quán)益,由于初次上線且投放時間較短,算法需要快速迭代和提升效果。推薦算法經(jīng)過冷啟動、引入CTR模型、 Thompson Sampling 調(diào)權(quán)等 3 輪迭代,快速優(yōu)化和提升了點擊率和核銷率。
? 3.2.1 冷啟動策略
冷啟動的策略設(shè)計主要包含兩部分:
1、ε-Greedy算法
解決冷啟動問題和優(yōu)化系統(tǒng) E&E 問題的最基礎(chǔ)、簡捷的方法。其基本思路為:在 (0, 1) 之間選擇一個較小的ε值,然后以ε的概率選擇流量,從權(quán)益底池中進(jìn)行隨機推薦,即完成勘探Exploration的功能,以 1 - ε 的概率選擇流量,基于先驗信息設(shè)計的決策樹推送權(quán)益,即利用現(xiàn)在已有的先驗信息完成開發(fā)Exploitation的功能。
**2、基于先驗信息設(shè)計決策樹
**
在上線初期,權(quán)益底池中的各類優(yōu)惠券還沒有曝光、點擊信息時,可以根據(jù)用戶的基礎(chǔ)畫像信息,以及用戶在站內(nèi)已有的瀏覽、加購、購買等行為的信息,作為設(shè)計決策樹時的一部分先驗信息。
? 3.2.2 CTR模型
權(quán)益推薦模塊,相比于用戶意圖識別,增加了“權(quán)益”這個實體,因此在特征的設(shè)計上需要更多的考慮權(quán)益維度、用戶和權(quán)益的交叉特征等。可以說用戶意圖識別是一個偏用戶洞察理解的問題,而權(quán)益?zhèn)€性化則是一個典型的推薦問題。
如圖所示,在特征的設(shè)計上,主要包括用戶維度特征、權(quán)益維度特征,以及用戶和權(quán)益的交叉特征:
用戶維度特征的設(shè)計,與用戶意圖識別模塊基本類似,可以復(fù)用用戶的基礎(chǔ)特征、行為特征。而在權(quán)益維度,則需要更多地考慮權(quán)益本身的差異,通過標(biāo)題、面額、所屬二方業(yè)務(wù)、權(quán)益所映射的類目 ID ,以及歷史的領(lǐng)取率、核銷率更細(xì)致地刻畫不同權(quán)益的差異性。同時,將用戶的特征與權(quán)益的特征進(jìn)行交叉,來學(xué)習(xí)不同畫像的用戶在指定權(quán)益上的偏好。
點擊率預(yù)估模型選取的是 XFTRL 。XFTRL 是基于阿里的 eXtreme Parameter Server 平臺開發(fā)的高性能異步 ASGD FTRL 算法,能夠支持千億規(guī)模的特征和長時間連續(xù)增量訓(xùn)練。
2017年,阿里巴巴推薦算法團隊和計算平臺 PAI 團隊合作打造了 eXtremeParameter Sever 機器學(xué)習(xí)平臺(XPS),廣泛全流量運行在手機淘寶的猜你喜歡、生活研究所、飛豬旅行和天貓推薦等大數(shù)據(jù)場景,取得了較好的效果。
FTRL 是一種 Online Learning Optimizer ,原始的 FTRL 的具體資料可以參考論文: Mcmahan, H. Brendan , et al. "Ad click prediction: a view fromthe trenches." Proceedings of the 19th ACM SIGKDD internationalconference on Knowledge discovery and data mining ACM, 2013.
XFTRL 算法是對經(jīng)典線性算法 FTRL 的擴展,是為了解決大規(guī)模數(shù)據(jù)下 FTRL 的一些缺點而提出的。集團內(nèi)的多數(shù)場景對于用戶行為時效性要求很高,實時/準(zhǔn)實時學(xué)習(xí)可以充分利用實時日志數(shù)據(jù),快速更新模型來適應(yīng)用戶最新行為,更好地強調(diào)近期樣本的重要性,可以實時快速迭代,快速反應(yīng)線上變化。
利用上線初期積累的3天的樣本訓(xùn)練模型,測試集評估 AUC 僅達(dá) 0.61 。另外,在分析時發(fā)現(xiàn)各個二方權(quán)益的曝光量差異較大,且長尾的二方權(quán)益的量很小,因此在短時間內(nèi)優(yōu)化算法, E&E 機制的設(shè)計就至關(guān)重要。
? 3.2.3 E&E 優(yōu)化
長尾 item 在推薦系統(tǒng)中很少或沒機會展示,導(dǎo)致 CTR 預(yù)估不準(zhǔn),需要探索性給他們創(chuàng)造一些機會,但不能給系統(tǒng)帶來太大損失,這就是 E&E 問題。針對 E&E 的問題,我們選取了比較經(jīng)典的 Thompson Sampling 算法進(jìn)行 explore 。
湯普森采樣(Thompson Sampling)基于貝葉斯思想,全部用概率分布來表達(dá)不確定性。
- 假設(shè)每個 item 有一個產(chǎn)生回報的概率p,我們通過不斷試驗來估計一個置信度較高的概率 p 的概率分布。
- 假設(shè)概率p的概率分布符合beta(wins,lose)分布,它有兩個參數(shù): wins, lose, 每個 item 都維護(hù)一個 beta 分布的參數(shù)。每次試驗選中一個 item ,有回報則該 item 的 wins 增加 1 ,否則 lose 增加 1 。
- 每次選擇 item 的方式是:用每個 item 現(xiàn)有的 beta 分布產(chǎn)生一個隨機數(shù)b,選擇所有 item 產(chǎn)生的隨機數(shù)中最大的那個 item 。
湯普森采樣算法的核心在于確定 Beta 分布的參數(shù),以表征后驗的 ctr ,如下圖所示,為湯普森采樣擬合后驗 ctr 的分布曲線:
?
湯普森采樣代碼實現(xiàn)比較簡單,在 Java 中可以基于 math3.distribution.BetaDistribution 包快速實現(xiàn)。在計算廣告和推薦領(lǐng)域應(yīng)用的效果與 UCB(Upper Confidence Bound ,一種基于估計的置信區(qū)間設(shè)計的E&E優(yōu)化策略)相比 competitive to or better ,且對于數(shù)據(jù)延遲反饋、批量數(shù)據(jù)反饋更 robust 。
四、實驗效果
整個春節(jié)促活項目,包括意圖識別“圈人” 和權(quán)益推薦的 “個性化承接”兩部分, 因此AB實驗設(shè)計上,包括圈人的干預(yù)桶與空桶的對比(衡量干預(yù)帶來的活躍度提升和DAU增量),和權(quán)益?zhèn)€性化承接算法桶與隨機桶的對比(衡量權(quán)益?zhèn)€性化算法的效能)。
手淘促活整體AB指標(biāo) (干預(yù)桶對比空桶)
- 干預(yù)桶日均來訪率提升1.2%
- 干預(yù)桶人群活躍度未下降的用戶比率提升1.42%
權(quán)益?zhèn)€性化AB指標(biāo)(算法桶對比隨機桶)
- 領(lǐng)取率提升40%
- 核銷率提升100%
五、對未來的期望
更完備的數(shù)據(jù)鏈路:
- 數(shù)據(jù)是算法的核心驅(qū)動力,完備的數(shù)據(jù)鏈路至關(guān)重要。目前有一部分場景的埋點和數(shù)據(jù)鏈路尚未打通,比如進(jìn)入二方承接頁的數(shù)據(jù)的回?fù)频膯栴},后續(xù)是重點推動和解決的。
引入”供需平衡“的分配機制:
- 在多供給物料混排時,綜合考慮供需關(guān)系,從博弈論和機制設(shè)計的角度考慮整個系統(tǒng),設(shè)計供給與需求之間的游戲規(guī)則,進(jìn)一步提升活躍用戶在鏈路核心節(jié)點的轉(zhuǎn)化率;
沉淀用戶生命期有效算法干預(yù)策略:
- 依靠現(xiàn)有的用戶增長權(quán)益智能發(fā)放體系,沉淀各生命期用戶算法干預(yù)組合策略。
原文鏈接
本文為云棲社區(qū)原創(chuàng)內(nèi)容,未經(jīng)允許不得轉(zhuǎn)載。
總結(jié)
以上是生活随笔為你收集整理的手淘促活那些事儿 | 智能投放算法框架助力用户增长的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【从入门到放弃-Java】并发编程-线程
- 下一篇: 干货!看云原生时代阿里云的四个“最”