推荐系统顶会RecSys’20亮点赏析
文 | banana
源 | 知乎
RecSys 2020原計劃是在南美洲巴西舉辦,因為疫情的原因不得不改到線上。雖說線上舉辦會議,參會效果會打折扣,但也為遠在北京的我提供了參會便利。得益于各方的努力和軟件的應用,整體來看此次參會的效果高于我對它的預期。這里分享一些從工程師角度發現的一些亮點,希望對大家有所幫助。
會議組織的一些亮點
先簡單介紹一下此次會議的組織方式,不得不說組織方確實用心了,有人員有的可能24個小時都沒休息。
為了使全球各時區的參會人員都能方便地聽到文章作者們的演講,大多數演講作者會在不同的時間段演講兩次
為了線上會議的流程可以順利進行,大會利用Whova軟件幫助整個流程,Whova當中包括了會議時間表,直播平臺,收集提問,論壇交友,活動組織等功能
為了參會者可以方便集合自由討論,大會用Gather.town 組織Poster Session等活動,大家可以自行在一個虛擬的空間進行交流,下圖,我站在這個虛擬空間過道的RECSYS面板前,算是拍照留念了。
Gather.town虛擬空間
會議最新研究的一些亮點
這是我第三次參加RecSys。推薦系統的研究進展并不快,在會議上常常可以看到一些奇怪的研究方向,重復的研究結果,不過也能看到一些亮點。
工業方向亮點有:
PURS: Personalized Unexpected Recommender System for Improving User Satisfaction,
Behavior-based Popularity Ranking on Amazon Video
Query as Context for Item-to-Item Recommendation
這些方法要么經過工業界AB測試的驗證,要么是工程實現簡單,并能解決一些問題。
學術方向亮點有:
Counterfactual Learning for Recommender System
Debiasing Item-to-Item Recommendations with Small Annotated Datasets
A Large-scale Open Dataset for Bandit Algorithms
這些方法要么新奇,未來前景廣泛,要么包含公開源代碼或者數據。
下面我對這些亮點一一做簡單的介紹
PURS: Personalized Unexpected Recommender System for Improving User Satisfaction
作者Pan Li是NYU Stern School of Business的一名博士生,這個工作是與阿里巴巴合作的成果,為了解決推薦系統當中的Filter Bubble的問題,他們提出了PURS,這個工作的優勢包括
在優酷App進行了AB測試,并在一些關鍵指標上面有很大的提升,其中人均觀看時長提升了4.6%
這個工作和Filter Bubble有關,這個話題大家討論很多,但是這個方向的有效的研究并不多,這個工作少有奏效的方法
這個工作考慮到了Exploration個性化的問題,有些人愿意探索不同類型的視頻內容,有些人就不愿意,作者有考慮到這一點,實現了個性化的Exploration
PURS的推薦思路在Embedding上面的實現
Behavior-based Popularity Ranking on Amazon Video
作者Lakshmi Ramachandran是Amazon Video的Applied Scientists,介紹了他們的Popularity Ranking的一個工作。
之前我以為Popularty Ranking用當前統計的Populartity即可完成排序,沒想到Popularity Ranking也可以利用機器學習解決Popularity Ranking當中的冷啟動的問題:一些新的內容無法通過普通的Popularity Ranking排到一個好的位置,曝光給用戶。
作者利用內容本身的一些文本信息、之前的流行度、和用戶的交互信息等數據預測當前的Popularity,最終以預測的Popularity進行排序。一個有趣的現象是內容在平臺上存在的時長這一特征,這個特征會給新內容高的分數。下面的截圖提到了Age Feature(在平臺上存在的時長)的影響
Age Feature(在平臺上存在的時長)的影響,X軸為Age,Y軸為預測的Popularity
Query as Context for Item-to-Item Recommendation
作者Moumita Bhattacharya是 ESTY.COM 一家電商網站的Senior Applied Scientist,她介紹了ESTY打造相關商品推薦的技術選擇。他們有6500萬的商品這使得他們的技術選擇和Amazon Video就會很不一樣,Amazon Video的視頻數量可能也就是幾萬的量級。
用戶所看到的ESTY.COM的相關物品推薦
ESTY.COM 相關物品推薦的兩個階段
相關物品推薦分成兩個階段,在第一個階段的Candidate Set Generation部分,他們利用Word2Vector的技術,把用戶搜索點擊的內容作為訓練數據,給每個內容生成Embedding,之后用 Faiss: A library for efficient similarity search,返回與當前物品最相似物品列表作為Candidate Set。
第二階段用lightGBM對Candidate Set進行排序。
他們提到的工作當中,有一個亮點是,他們利用了Context進行相關物品的個性化。下圖是提到的可以將當前的節目作為Context,比如說在萬圣節時期,對于一個給一個紅色推薦相關的物品,是不是可以把一些適合萬圣節的物品,同時相關的物品推薦出來,而不是只單單推薦紅色的帽子。
在萬圣節期間,可以利用當前的節日作為Context,推薦符合當前節日的物品
Counterfactual Learning for Recommender System
作者Zhenhua Dong是華為諾亞方舟實驗室的Principal Researcher,這次演講匯總了華為在Counterfactual方向上的一系列成果。為了解決Counterfactual的問題,作者提出Uniform Unbiased Data,通過在從1%流量當中,隨機選擇內容地向用戶展現,使得每一個內容都有機會收集到用戶的反饋。利用Uniform Unbiased Data,作者展開了一系統的研究和實驗,取得了一系列的成果,其中之一是利用這1%的流量產生的Unbiased Data,創造了3%的指標提升。
作者在介紹Counterfactual machine learning
Debiasing Item-to-Item Recommendations with Small Annotated Datasets
作者Tobias Schnabel是來自微軟研究院的研究員,提出利用小規模的標注數據來提升Item-to-Item的推薦(和之前提到的一個物品的相關推薦一樣)。智能不夠,人工來湊。實驗表明這種方式的確有效,這說明我們的訓練數據當中有很多干擾,并不能完全表示用戶對所有物品的喜好。工業界或許可以利用之前提到的Unbiased Data達到Small Annotated Dataset的效果。
文章當中的方法比其它的方法都要好
Large-scale Open Dataset for Bandit Algorithms
From Workshop: REVEAL 2020: Bandit and Reinforcement Learning from User Interactions
Yann Lecun說RL是整個機器學習蛋糕上面的櫻桃
作者Yuta Saito是一名本科生,在這次Workshop展示了他在RL&Bandits方向的工作。
強化學習的核心問題之一是如何在上線或者進行實驗之前,評估訓練好的強化學習的模型,也就是Offline Policy Evaluation。學術界提出了很多的方法,很多都是用模擬器產生的數據,但是少有一些實際數據的支持。
這個工作提供了兩組通過Uniform Rank和 Bernoliour Rank產生的服飾購物行為數據,可以用來測評不同的Offline Policy Evaluation的效果,也可以用來開發新的Policy,用Offline Policy Evaluation來評測 。
https://github.com/st-tech/zr-obp Open Bandits Pipeline 開源代碼代碼質量高,有很多代碼注釋。
在3個展示位置收集的用戶購物行為
作者提出的OPEN BANDIT PIPELINE
推薦系統不像圖像識別,理論上推薦系統是典型的強化學習的應用場景,但限于各種工程約束,理論的不成熟,強化學習一直沒有很好地應用于推薦系統,最近幾年業界開始有成功的應用。這個領域值得繼續關注。
總結
這次線上RecSys體驗別具一格,并沒有像我之前擔心的那樣,效果打很多折扣,很多參會者也是有很認真地了準備演講。希望下次RecSys能看到更多的有亮點的工作。
后臺回復關鍵詞【入群】
加入賣萌屋NLP/IR/Rec與求職討論群
有頂會審稿人、大廠研究員、知乎大V和妹紙
等你來撩哦~
總結
以上是生活随笔為你收集整理的推荐系统顶会RecSys’20亮点赏析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 谈谈怎样提高炼丹手速
- 下一篇: 搜索引擎核心技术与算法 —— 倒排索引初