近期有哪些值得读的推荐系统论文?来看看这份私人阅读清单
在碎片化閱讀充斥眼球的時(shí)代,越來(lái)越少的人會(huì)去關(guān)注每篇論文背后的探索和思考。在這個(gè)欄目里,你會(huì)快速 get 每篇精選論文的亮點(diǎn)和痛點(diǎn),時(shí)刻緊跟 AI 前沿成果。
本期「本周值得讀」關(guān)注的是「推薦系統(tǒng)」領(lǐng)域,我們篩選了 10 篇來(lái)自 SIGIR 2020、KDD 2020 等頂會(huì)的最新論文,下面就一起來(lái)看看讀過(guò)這些論文的推薦人的推薦理由與個(gè)人評(píng)價(jià)吧!
本期推薦人:紀(jì)厚業(yè),北京郵電大學(xué) DMGroup 在讀博士生,其研究方向包括異質(zhì)圖分析,圖表示學(xué)習(xí)(圖神經(jīng)網(wǎng)絡(luò))和推薦系統(tǒng)。目前已經(jīng)在 WWW,EMNLP 和 PRICAI 上發(fā)表多篇相關(guān)論文。
#SIGIR 2020
@紀(jì)厚業(yè)
本文是武漢大學(xué)和阿里巴巴發(fā)表于 SIGIR 2020 的工作。在實(shí)際的推薦場(chǎng)景下,商品通常可以劃分為不同的領(lǐng)域,例如圖書和電影。雖然它們屬于不同的領(lǐng)域,但是可以較為一致的反映用戶的偏好。
本文對(duì)用戶和商品在不同場(chǎng)景下的特點(diǎn)進(jìn)行了建模并提出一種名為 CATN 的模型。CATN 通過(guò)注意力機(jī)制學(xué)習(xí)不同領(lǐng)域之間的協(xié)同性。同時(shí),作者還引入了評(píng)論信息來(lái)進(jìn)一步強(qiáng)化用戶的表示。最后,在評(píng)分預(yù)測(cè)實(shí)驗(yàn)上,作者提出的 CATN 可以大幅度超越 SOTA 的算法。
* 論文標(biāo)題:CATN: Cross-Domain Recommendation for Cold-Start Users via Aspect Transfer Network
* 論文鏈接:http://www.paperweekly.site/papers/3748
*?源碼鏈接:https://github.com/AkiraZC/CATN
#KDD 2020
@紀(jì)厚業(yè)
本文是阿里巴巴發(fā)表于 KDD 2020 的工作。工業(yè)場(chǎng)景下通常存在多種不同的形式輔助信息,這實(shí)際上可以認(rèn)為是多視圖信息。通過(guò)充分挖掘多方面的信息,通常可以帶來(lái)一些效果的提升。
但是,本文作者 diss 之前的工作沒(méi)有深入考慮多視圖學(xué)習(xí)的兩個(gè)基礎(chǔ)性問(wèn)題:1)如何去除多視圖帶來(lái)的冗余信息并且單個(gè)向量無(wú)法充分描述所有信息;2)各個(gè)視圖來(lái)自不同的源,其分布的差異也較大。為此,作者提出了一種多視圖對(duì)齊的方法來(lái)解決上述問(wèn)題。
具體的說(shuō),作者提出了名為 M2GRL 框架來(lái)學(xué)習(xí)多視圖下的節(jié)點(diǎn)表示。多任務(wù)學(xué)習(xí)可以較好地融合單個(gè)視圖的內(nèi)部信息和多個(gè)視圖的交叉信息。最后,作者通過(guò)大量的實(shí)驗(yàn)驗(yàn)證了 M2GRL 的有效性。
* 論文標(biāo)題:M2GRL: A Multi-task Multi-view Graph Representation Learning Framework for Web-scale Recommender Systems
* 論文鏈接:http://www.paperweekly.site/papers/3747
*?源碼鏈接:https://github.com/99731/M2GRL
#SIGIR 2020
@紀(jì)厚業(yè)
本文是阿里和螞蟻金服發(fā)表在 SIGIR 2020 上的論文。為了更好地刻畫多種用戶行為并融合知識(shí)圖譜進(jìn)行高效推薦,作者設(shè)計(jì)了一種 Adaptive Target-Behavior Relational Graph network (ATBRG) 來(lái)自適應(yīng)地抽取結(jié)構(gòu)信息和知識(shí)信息。
同時(shí),作者還提出了一種 graph prune technique 來(lái)構(gòu)建特定目標(biāo)的關(guān)系圖。此外,作者聯(lián)合了 relation-aware extractor layer 和 representation activation layer 來(lái)進(jìn)行端到端的訓(xùn)練和學(xué)習(xí)。最后,作者將算法部署到淘寶 APP 上并取得了 5.1% 的 CTR 提升。
* 論文標(biāo)題:ATBRG: Adaptive Target-Behavior Relational Graph Network for Effective Recommendation
* 論文鏈接:https://www.paperweekly.site/papers/3811
#SIGIR 2020
@紀(jì)厚業(yè)
本文是京東發(fā)表于 SIGIR 2020 的工作,文章為京東在推薦系統(tǒng)領(lǐng)域的實(shí)踐經(jīng)驗(yàn)總結(jié),介紹了自 2019 年就部署在京東上的搜索推薦系統(tǒng)框架 DPSR。本文是相關(guān)從業(yè)人員的很好的參考資料。作者首先介紹了推薦系統(tǒng)的兩個(gè)問(wèn)題:如何召回一些相關(guān)性的商品以及如何根據(jù)用戶的偏好進(jìn)行個(gè)性化推薦。?
整個(gè)模型并不復(fù)雜,重要的是作者介紹了其設(shè)計(jì)經(jīng)驗(yàn)其整個(gè)業(yè)務(wù)的流程框架圖。只要把流程打通,進(jìn)一步的做模型優(yōu)化也會(huì)比較容易。同時(shí),作者還對(duì)模型的 CPU 和 GPU 資源消耗進(jìn)行了介紹。在算法復(fù)雜度和資源消耗如何折中也是一個(gè)工業(yè)落地需要考慮的問(wèn)題。
* 論文標(biāo)題:Towards Personalized and Semantic Retrieval: An End-to-End Solution for E-commerce Search via Embedding Learning
* 論文鏈接:https://www.paperweekly.site/papers/3810
#SIGIR 2020
@紀(jì)厚業(yè)
在實(shí)際的推薦系統(tǒng)中,候選商品的生成一個(gè)非常大的挑戰(zhàn)。我們需要從海量(十億級(jí))的商品中來(lái)選擇幾百個(gè)用戶購(gòu)買意圖較強(qiáng)的商品。這也是工業(yè)界中的召回過(guò)程。目前,工業(yè)界的解決方案主要是通過(guò)商品相似性 item2item 來(lái)進(jìn)行商品召回,但是其并沒(méi)有考慮單個(gè)用戶的偏好及商品的屬性。?
本文針對(duì)上述問(wèn)題,提出了一種 attribute-aware collaborative filtering (A2CF) 方法在保證準(zhǔn)確度的前提下實(shí)現(xiàn)了可解釋性的推薦。通過(guò)對(duì)用戶商品屬性進(jìn)行分析,可以在屬性層面反映他們的偏好。最后,作者在大量數(shù)據(jù)上驗(yàn)證了算法的有效性。
* 論文標(biāo)題:Try This Instead: Personalized and Interpretable Substitute Recommendation
* 論文鏈接:http://www.paperweekly.site/papers/3762
*?源碼鏈接:https://rockytchen@bitbucket.org/rockytchen/a2cf-sigir20.git
#SIGIR 2020
@紀(jì)厚業(yè)
本文發(fā)表在 SIGIR 2020 上。現(xiàn)在很多推薦算法都嘗試引入異質(zhì)知識(shí),如知識(shí)圖譜,來(lái)提升推薦系統(tǒng)的效果。但是,這些工作還是沒(méi)有很好的考慮多方面的商品特性,進(jìn)而無(wú)法精確的學(xué)習(xí)商品表示。
針對(duì)上述問(wèn)題,本文提出一種基于圖神經(jīng)網(wǎng)絡(luò)的推薦網(wǎng)絡(luò) multi-view item network (MVIN) 的算法,同時(shí)從用戶角度和實(shí)體角度來(lái)學(xué)習(xí)多個(gè)視角下的商品表示,進(jìn)而進(jìn)行商品推薦。?
作者在 3 個(gè)真實(shí)數(shù)據(jù)集 MovieLens-1M (ML-1M),LFM-1b 2015 (LFM-1b) 和 Amazon-Book (AZ-book) 上驗(yàn)證了算法的有效。近些年,將知識(shí)圖譜與推薦系統(tǒng)結(jié)合的文章越來(lái)越多,引入外部知識(shí)很容易能夠從數(shù)據(jù)層面上來(lái)提升整個(gè)算法的效果。
* 論文標(biāo)題:MVIN: Learning Multiview Items for Recommendation
* 論文鏈接:https://www.paperweekly.site/papers/3807
*?源碼鏈接:https://github.com/johnnyjana730/MVIN
#arXiv?2020
@紀(jì)厚業(yè)
本文來(lái)自羅格斯大學(xué)和清華大學(xué),這是近期讀到的非常驚艷的一篇推薦論文。以往的推薦算法最常見的策略就是學(xué)習(xí)用戶和商品的表示,然后利用相似度函數(shù)來(lái)進(jìn)行推薦。本文受最近的符號(hào)推理啟發(fā),將邏輯推理與表示學(xué)習(xí)結(jié)合起來(lái),利用AND,OR,NOT 來(lái)輔助學(xué)習(xí)節(jié)點(diǎn)表示。在多個(gè)數(shù)據(jù)集上大幅度超越現(xiàn)有算法。
神經(jīng)網(wǎng)絡(luò)被詬病的一點(diǎn)就是推理能力不行,本文在推薦上做出了很好的嘗試和驗(yàn)證,感覺(jué)算是挖了值得填的大坑。
* 論文標(biāo)題:Neural Collaborative Reasoning
* 論文鏈接:http://www.paperweekly.site/papers/3802
#SIGIR 2020
@紀(jì)厚業(yè)
本文是中國(guó)人民大學(xué)和阿里巴巴發(fā)表于 SIGIR 2020 的工作。現(xiàn)有的時(shí)序推薦算法通常基于最大似然進(jìn)行訓(xùn)練,并能夠針對(duì)用戶偏好來(lái)生成或選擇一些商品。但是,之前所有的工作通常只是聯(lián)合的進(jìn)行推薦,無(wú)法有效的分析是哪些因素影響了最終的推薦結(jié)果。
為此,作者提出了一種 Multi-Factor Generative Adversarial Network (MFGAN) 的算法來(lái)顯式地刻畫多種推薦因子。作者借鑒了 GAN 的思想,一個(gè)生成器來(lái)生成可能的推薦商品,多個(gè)判別器來(lái)評(píng)估不同因子對(duì)推薦的影響。最后,作者做了大量的實(shí)驗(yàn)來(lái)驗(yàn)證本文所提出算法的有效性。
* 論文標(biāo)題:Sequential Recommendation with Self-Attentive Multi-Adversarial Network
* 論文鏈接:http://www.paperweekly.site/papers/3752
#SIGIR 2020
@紀(jì)厚業(yè)
本文是阿姆斯特丹大學(xué)和國(guó)防科技大學(xué)發(fā)表于 SIGIR 2020 的工作。對(duì)話和提問(wèn)式的推薦系統(tǒng)已經(jīng)成為近些年的研究熱點(diǎn)。本文提出了一種基于提問(wèn)式的推薦算法,Qrec 能夠交替地自動(dòng)選擇問(wèn)題和構(gòu)建答案。
本文是基于矩陣分解框架,并沒(méi)有使用現(xiàn)在非常火的深度學(xué)習(xí)技術(shù),通過(guò)問(wèn)答結(jié)果來(lái)交替的更新用戶及商品的表示。同時(shí),可以推斷出用戶想法進(jìn)而生成一系列問(wèn)題。大量的實(shí)驗(yàn)結(jié)果驗(yàn)證了本文算法的有效性。本文沒(méi)有盲目跟風(fēng)使用深度學(xué)習(xí)技術(shù),在現(xiàn)在的推薦系統(tǒng)論文中感覺(jué)獨(dú)樹一幟。
* 論文標(biāo)題:Towards Question-based Recommender Systems
* 論文鏈接:http://www.paperweekly.site/papers/3803
#SIGIR 2020
@紀(jì)厚業(yè)
本文是昆士蘭大學(xué)和格里菲斯大學(xué)發(fā)表于 SIGIR 2020 的工作。近些年,如何更好地構(gòu)建魯棒的機(jī)器學(xué)習(xí)系統(tǒng)是非常熱門的研究方向,尤其是在很多對(duì)抗攻擊算法不斷發(fā)展的情況下。在實(shí)際工業(yè)場(chǎng)景下,推薦系統(tǒng)所能拿到的數(shù)據(jù)通常會(huì)有各種各種的噪音等問(wèn)題并且可能遭受到攻擊。
本文針對(duì)實(shí)際數(shù)據(jù)的質(zhì)量問(wèn)題,研究了如何在低質(zhì)量數(shù)據(jù)上構(gòu)建更加穩(wěn)定的推薦系統(tǒng)。同時(shí),作者希望能夠?qū)σ恍┢墼p也進(jìn)行檢測(cè)。通過(guò)上述兩方面的協(xié)同努力,作者同時(shí)實(shí)現(xiàn)了欺詐檢測(cè)和高質(zhì)量的推薦。最后,大量的實(shí)驗(yàn)驗(yàn)證了本文算法的有效性。
* 論文標(biāo)題:GCN-Based User Representation Learning for Unifying Robust Recommendation and Fraudster Detection
* 論文鏈接:http://www.paperweekly.site/papers/3749
更多閱讀
????
現(xiàn)在,在「知乎」也能找到我們了
進(jìn)入知乎首頁(yè)搜索「PaperWeekly」
點(diǎn)擊「關(guān)注」訂閱我們的專欄吧
關(guān)于PaperWeekly
PaperWeekly 是一個(gè)推薦、解讀、討論、報(bào)道人工智能前沿論文成果的學(xué)術(shù)平臺(tái)。如果你研究或從事 AI 領(lǐng)域,歡迎在公眾號(hào)后臺(tái)點(diǎn)擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
總結(jié)
以上是生活随笔為你收集整理的近期有哪些值得读的推荐系统论文?来看看这份私人阅读清单的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 丰田、斯巴鲁将联合开发电动汽车:2026
- 下一篇: 游戏《地平线:零之曙光重制版》PC 端需