盘一盘推荐系统里值得一读的那些论文
工業中常用的推薦算法其實并不像論文中那么復雜,大多數的時候是穩定的模型、充分的特征工程和各種精妙的業務策略等。當然,如果你想,也可以做的很復雜....大部分時間讀論文是在拓展思路并結合自身面臨的問題去復現或者再創造,本文盤一盤在思路枯竭的時候,還有哪些論文可以值得一讀。當然,本文是個人經驗和閱讀偏好的一些總結,沒出現的也不代表不值得一讀,如果有分享的論文,可以在評論區貼出來
1、Collaborative Filtering Recommender Systems
關于協同過濾最經典的綜述,近20年引用量超過1000的經典論文。
2、The Wisdom of The Few
看到這么個有吸引力的名字,你不會覺得它是一篇學術論文,但實際上,它是的。這是2009年Amatriain等人發表在ACM的一篇關于推薦系統的文章。所謂少數人的智慧,實際指是的作者提出的基于專家的協同過濾在某些方面要優勝于傳統的CF算法。
之所以要提出專家CF的算法取代傳統的CF,是基于傳統CF的一些弊病,比如數據的稀疏性,數據噪聲以及計算量的龐大等等,而正是這些數據上的原因導致傳統 CF算法推薦多樣性不足、推薦不準確以及推薦可擴展性不良好等種種問題。具體的可以讀一下阿穩的文章[參考資料1],解析的很詳細。
3、Item-Based Collaborative Filtering Recommendation Algorithms
Iterm-based的基本思想是預先根據所有用戶的歷史偏好數據計算物品之間的相似性,然后把與用戶喜歡的物品相類似的物品推薦給用戶。還是以之前的例子為例,可以知道物品a和c非常相似,因為喜歡a的用戶同時也喜歡c,而用戶A喜歡a,所以把c推薦給用戶A。
4、Restricted Boltzmann Machines for Collaborative Filtering
大多數現有的協同過濾方法無法處理非常大的數據集。在本文中,我們展示了如何使用一種稱為受限玻爾茲曼機器(RBM)的兩層無向圖形模型來對表格數據(tabular data)進行建模,如用戶對電影的評分。目前Netflix使用的主要推薦算法之一。
在本文中,作者使用了一中兩層無向圖形模型,將受限玻爾茲曼機器延伸到為表格或計數數據進行建模。在這些模型中使用最大似然進行學習是很困難的,但是論文的研究表明,學習可以通過跟蹤一個稱為“對比分歧”(Contrastive Divergence)的不同目標函數的梯度的近似來實現。
5、LFM
Factorization Meets the Neighborhood: a Multifaceted Collaborative Filtering Model ,LFM算法是屬于隱含語義模型的算法,不同于基于鄰域的推薦算法。它將評分矩陣分解為 item-feature 和 user-feature矩陣,feature數量事先人工確定,但是這兩個矩陣參數未知,首先隨機選取參數,再以此梯度下降迭代即可得到。
6、ConvMF
Convolutional Matrix Factorization for Document Context-Aware Recommendation,一種文檔上下文環境設置推薦模型,卷積矩陣因式分解(ConvMF),通過利用卷積神經網絡(CNN)捕獲項目描述文檔的上下文信息,進一步提高了評分預測精度。ConvMF正是將CNN無縫集成到PMF中,而PMF通常用于推薦任務。綜合模式遵循推薦目標,最終有效地利用協作信息和上下文信息。因此,即使評分數據非常稀疏,ConvMF也能準確地預測未知的評分。
7、Personalized Tag Recommendation
Pairwise Interaction Tensor Factorization for Personalized Tag Recommendation,個性化標簽推薦是向用戶推薦標簽列表以注釋(例如描述)項的任務。一個例子是音樂網站,用戶想要標記一首歌,系統推薦他一個關鍵字列表,用戶可以使用這個歌曲。為了推斷推薦列表,個性化標簽推薦器可以使用系統的歷史數據,即過去的標記行為。例如,推薦者可以利用該用戶過去給其他(類似)項目的標簽,或者類似用戶對類似項目所給予的相似標簽。
8、Recommendations Item-to-Item Collaborative Filtering
亞馬遜的經典論文,其他的論文其實都是在這基礎上建立起來的。在Amazon,工程師們利用推薦算法以其在電子商務網站的用途而著稱,它們利用有關一個顧客的興趣作為輸入,來產生一個推薦商品的列表。很多應用僅僅使用顧客購買并明確表示代表其興趣的商品,但它們也可以利用其他屬性,包括已瀏覽的商品、人口統計特征數據、主題興趣,以及偏愛的藝術家。
大多數推薦算法,都始于先找出一個顧客集合,他們買過和評級過的商品,與當前用戶買過和評級過的商品有重疊。算法把來自這些相似顧客的商品聚集起來,排除該用戶已經購買過或評級過的商品,并向該用戶推薦其余的商品。
9、Matrix Factorization Techniques for RS
Matrix Factorization Techniques for Recommender Systems 一文是一篇在推薦系統領域里非常經典、頻繁被引用的論文。該論文于2009年發表在IEEE下的“COMPUTER”期刊上,是推薦系統領域第一篇比較正式、全面介紹融合了機器學習技術的矩陣分解算法,對于近幾年基于矩陣分解的推薦算法的研究起到了非常大的影響,一作是雅虎的研究人員Y.Koren。雖然該篇論文在推薦系統領域有著很重大的影響,但是論文所介紹的核心算法無論是在理論理解還是編程實現上都是比較容易的,這也符合“一個好的數學模型一定是簡單的”的原則。
參考資料
- https://zhuanlan.zhihu.com/p/27918429
- https://www.cin.ufpe.br/~idal/rs/Amazon-Recommendations.pdf
- https://datajobs.com/data-science-repo/Recommender-Systems-%5BNetflix%5D.pdf
總結
以上是生活随笔為你收集整理的盘一盘推荐系统里值得一读的那些论文的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 向量召回 MIND多兴趣双塔模型
- 下一篇: 推荐竞赛金牌技能!