你关心的问题都在这!爱奇艺用户留存预测挑战赛Baseline上线
近日,愛奇藝宣布聯(lián)合數據挖掘頂級會議——網絡搜索和數據挖掘國際會議WSDM 2022(ACM International Conference onWeb Search and Data Mining)發(fā)起用戶留存預測挑戰(zhàn)賽。本屆大賽采取線上參與形式,由愛奇藝專家團隊組織舉辦,旨在提供一個通用的數據集與一個公平的測試平臺,對更有效的用戶召回預測算法模型進行研究。
本次大賽基于愛奇藝APP脫敏和采樣后的數據信息,預測用戶的7日留存傾向度。參賽隊伍需要設計相應的算法進行數據分析和預測。
大賽報名以來,已經吸引了來自海內外的300多支隊伍參賽。本周一,挑戰(zhàn)賽排行榜也正式開啟,參賽選手們都在積極備戰(zhàn),提交作品。
這次比賽的選手有多努力呢?工作日凌晨一點還在提交數據的這位盆友,respect!
不過,相信還是有不少同學對賽題無從下手,愛奇藝賽題組委會也應邀給大家送“參考答案”來了,希望這套baseline,可以幫助大家理清思路,輕松上分。
目前,挑戰(zhàn)賽的Baseline已經在愛奇藝官網上線了,大家可以點擊“閱讀原文”或者在以下鏈接獲取👇
http://challenge.ai.iqiyi.com/detailraceId=61600f6cef1b65639cd5eaa6
除了Baseline,我們也整理了大家最關心的一些問題羅列如下,大家可以自行取用啦。
Q: 這個比賽是有發(fā)論文的機會嗎?
A: 我們正在與WSDM組委會溝通,會盡快反饋回答
Q: 這個比賽訓練集的label是什么呀,沒看見label?
A: 請自己思考合適的label構造邏輯。
Q: 用戶啟動app即屬于登陸用戶, 還是需要有播放行為或互動行為?
A: 啟動app即可。
Q: 用戶啟動,需要對launchtype做判斷才算登陸用戶嗎?
A: 不需要,都算登陸。
Q: 有沒有baseline?
A: 為了讓比賽更公平,Baseline會在A榜開放后一周左右公布。到時群里會通知。
Q: 一個用戶進訓練集的取樣時間范圍是怎么定的?怎么判斷一個時間點上,是沒有取樣還是就是用戶這些天沒有登陸呢?
A:?1,為了脫敏,和避免預測時間點過于集中,每個用戶行為的取樣開始時間、結束時間、預測時間點(end_date),可能是不同的。
2,雖然每個用戶的取樣時間起始結束點不同,但訓練集保證,每個用戶[date 131, date 160]這1個月的行為都會取樣到(如果有)。
3,假如1個用戶在訓練集中給出的行為范圍是[date_min, date_max],那么這個用戶在[date_min,date_max]的行為,一定完整地在訓練集中給出了。這個時間范圍外的,不保證取樣到(除非滿足第2點)。
4,如果1個用戶需要在測試集中被預測,那么會給定end_date。end_date>=該用戶的date_max。如果end_date>date_max,會保證(date_max, end_date]之間用戶沒有登錄行為。
Q: 每一天的數據也是按照順序排列的么?
A: 不保證順序。行為發(fā)生時間最小粒度只到天級。
最后,如果你還有問題,或者想找到一起打比賽的盆友,歡迎添加“愛奇藝技術產品團隊小助手(微信id:iqiyixiaozhushou) 備注 wsdm,進入挑戰(zhàn)賽選手溝通群,與大家一起“卷起來”!
看完心動了嗎?
戳👇“閱讀原文”直達招聘頁面
即刻加入愛奇藝!
也許你還想看
以AI賦能可持續(xù)的用戶增長,愛奇藝聯(lián)合WSDM發(fā)起用戶留存預測挑戰(zhàn)賽
愛奇藝M2VOC挑戰(zhàn)賽落幕,6篇論文被ICASSP2021收錄
?關注我們,更多精彩內容陪伴你!
總結
以上是生活随笔為你收集整理的你关心的问题都在这!爱奇艺用户留存预测挑战赛Baseline上线的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Ubuntu16.04 n次装机血泪史(
- 下一篇: css实现3d正方体旋转