阅读笔记:Item-based Collaborative Filtering Recommendation Algorithms
概要:
推薦系統(tǒng)通過信息獲取技術(shù)解決在線的個(gè)人的消息、產(chǎn)品或者服務(wù)的推薦問題。這些系統(tǒng),特別是基于k臨近協(xié)同過濾算法,在網(wǎng)絡(luò)上取得了廣泛的成功。可用信息和訪問人數(shù)的巨大增加成了推薦系統(tǒng)一個(gè)難題。基于商品的協(xié)同過濾推薦算法應(yīng)運(yùn)而生,通過分析用戶特征矩陣計(jì)算推薦信息。本文主要分析不同的基于商品的推薦算法,還會同k臨近過濾算法比較,同時(shí)提供比現(xiàn)存最好的基于用戶算法更好的算法。
一、協(xié)同過濾算法分類
協(xié)同過濾算法主要分為:1.基于存儲 2.基于模型
基于存儲:它利用整個(gè)用戶商品數(shù)據(jù)來產(chǎn)生預(yù)測,使用靜態(tài)的方法找到相似用戶,他們評價(jià)了不同的商品但是評價(jià)相似或者他們想買相似的商品,一旦形成相似組群,系統(tǒng)就會整合組群來產(chǎn)生預(yù)測。這種方法也被叫做臨近算法或者基于用戶的協(xié)同過濾算法,得到廣泛的應(yīng)用。
面臨的問題:
1.稀疏問題:商品很多,即使是非常愛買東西的用戶買的物品可能都不會超過總商品的1%。
2.性能:計(jì)算量隨著用戶和商品的增加而增加。因此數(shù)據(jù)量一大性能就降低。?
基于模型:它通過產(chǎn)生一個(gè)用戶評分模型來推薦,這個(gè)算法采用了概率論的方法,通過用戶給出的期望價(jià)值來給其他商品打分,這個(gè)模型通過機(jī)器學(xué)習(xí)算法比如貝葉斯網(wǎng)絡(luò), clustering, 和 rule-based等等實(shí)現(xiàn)的。貝葉斯網(wǎng)絡(luò)模型為協(xié)同過濾算法提供了一個(gè)概率模型,Clustering模型把協(xié)同過濾算法當(dāng)成一個(gè)分類問題,通過將相似者分組然后估計(jì)該客戶在這個(gè)類別的可能性,通過這些來計(jì)算商品評分的可能性。rule-based通過共同購買的商品的相關(guān)度來產(chǎn)生基于商品相關(guān)度的推薦。
二、協(xié)同過濾算法用到的度量技術(shù)
商品相似度:
1.cosine相似度:只考慮item向量的點(diǎn)積
2.correlation-based相似度(Pearson相似度):考慮了item的平均評分
3.adjusted cosine相似度:考慮了用戶對item的平均評分
預(yù)測計(jì)算:
1.使用相似度加權(quán)平均
2.使用回歸模型。使用加權(quán)平均時(shí),采用的與預(yù)測物品i相似的物品 j的相似度Sim j* j的評分Rj。而使用回歸模型時(shí),它會計(jì)算出一個(gè)線性回歸 f(j) =α*avg(Rj) + β?+?ξ,從而計(jì)算出一個(gè)不同于Rj的分值,然后再使用加權(quán)平均。
評價(jià)系統(tǒng)好壞的方式:
1.statistical accuracy metrics:MOE、RMSE
2.decision support accuracy metrics:reversal rate, weighted errors, ROC
三、結(jié)論
1.基于物品的算法預(yù)測結(jié)果要比基于用戶的算法預(yù)測結(jié)果好
2.基本的基于物品的算法,模型大小越大,推薦質(zhì)量越好,但是基于回歸的物品算法,先是隨著模型大小增加而增加,之后質(zhì)量下降。
3.adjusted cosine similarity效果比較好
轉(zhuǎn)載于:https://www.cnblogs.com/herumw/p/9466401.html
總結(jié)
以上是生活随笔為你收集整理的阅读笔记:Item-based Collaborative Filtering Recommendation Algorithms的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: poj1015 Jury Comprom
- 下一篇: python第一堂课