协同过滤推荐算法简介
協同過濾(Collaborative Filtering,簡稱CF)推薦算法的主要功能是預測和推薦,“人以類聚,物以群分”。可以分為兩類,分別是基于用戶的協同過濾算法(user-based collaboratIve filtering),和基于物品的協同過濾算法(item-based collaborative filtering)。
基于用戶的協同過濾算法(user-based collaboratIve filtering)
如果A,B兩個用戶都購買了x,y,z三本圖書,并且給出了5星的好評。那么A和B就屬于同一類用戶。可以將A看過的圖書w也推薦給用戶B。
如何通過用戶對不同商品的態度和偏好尋找相似的用戶。
相關系數的分類
0.8-1.0 極強相關
0.6-0.8 強相關
0.4-0.6 中等程度相關
0.2-0.4 弱相關
0.0-0.2 極弱相關或無相關
為相似的用戶提供推薦物品。
加權排序推薦,提取了相似的幾個用戶評價過的另外商品。并對不同商品的評分進行相似度加權,然后推薦給用戶。
總結:1、數據稀疏性。一個大型的電子商務推薦系統一般有非常多的物品,用戶可能買的其中不到1%的物品,不同用戶之間買的物品重疊性較低,導致算法無法找到一個用戶的鄰居,即偏好相似的用戶;2、算法擴展性。最近鄰居算法的計算量隨著用戶和物品數量的增加而增加,不適合數據量大的情況使用。
基于物品的協同過濾算法(item-based collaborative filtering)
如果用戶A同時購買了商品1和商品2,那么說明商品1和商品2的相關度較高。當用戶B也購買了商品1時,可以推斷他也有購買商品2的需求。
尋找相似的物品。
為用戶提供基于相似物品的推薦。
加權排序推薦
總結:因為物品直接的相似性相對比較固定,所以可以預先在線下計算好不同物品之間的相似度,把結果存在表中,當推薦時進行查表,計算用戶可能的打分值,可以同時解決user-based遇到的兩個問題(user-based總結里面提到的兩個問題)。
Item-based相似度計算
基于余弦(Cosine-based)的相似度
基于關聯(Correlation-based)的相似度
調整的余弦(Adjusted Cosine)相似度
Item-based預測值計算
加權求和
回歸
作者通過實驗對比結果得出結論:1. Item-based算法的預測結果比User-based算法的質量要高一點。2. 由于Item-based算法可以預先計算好物品的相似度,所以在線的預測性能要比User-based算法的高。3. 用物品的一個小部分子集也可以得到高質量的預測結果。
本文來自:https://blog.csdn.net/huagong_adu/article/details/7362908
總結
以上是生活随笔為你收集整理的协同过滤推荐算法简介的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 钉钉支持鸿蒙系统,钉钉鸿蒙版app
- 下一篇: 如何正确测试电源的纹波?