基于python的电影推荐系统
基于用戶的協(xié)同推薦算法
??? 推薦系統(tǒng)在我們的日常生活之中無處不在,例如,在電子商城購物,系統(tǒng)會根據(jù)用戶的記錄或者其他的信息來推薦相應(yīng)的產(chǎn)品給客戶,是一種智能的生活方式。之所以增加過濾,是因為在實現(xiàn)過濾推薦的時候是根據(jù)其他人的行為來做預(yù)測的,基于相似用戶的喜好來實現(xiàn)用戶的喜好預(yù)測。
簡要介紹:?????????
通過找到興趣相投,或者有共同經(jīng)驗的群體,來向用戶推薦感興趣的信息。
舉例,如何協(xié)同過濾,來對用戶A進(jìn)行電影推薦?
答:簡要步驟如下:
找到用戶A(user_id_1)的興趣愛好
找到與用戶A(user_id_1)具有相同電影興趣愛好的用戶群體集合Set<user_id>
找到該群體喜歡的電影集合Set<movie_id>
將這些電影Set<Movie_id>推薦給用戶A(user_id_1)
具體實施步驟如何?
答:簡要步驟如下
(1)畫一個大表格,橫坐標(biāo)是所有的movie_id,縱坐標(biāo)所有的user_id,交叉處代表這個用戶喜愛這部電影
如上表:
橫坐標(biāo),假設(shè)有10w部電影,所以橫坐標(biāo)有10w個movie_id,數(shù)據(jù)來源自數(shù)據(jù)庫
縱坐標(biāo),假設(shè)有100w個用戶,所以縱坐標(biāo)有100w個user_id,數(shù)據(jù)也來自數(shù)據(jù)庫
交叉處,“1”代表用戶喜愛這部電影,數(shù)據(jù)來自日志
畫外音:什么是“喜歡”,需要人為定義,例如瀏覽過,查找過,點贊過,反正日志里有這些數(shù)據(jù)
(2)找到用戶A(user_id_1)的興趣愛好
如上表,可以看到,用戶A喜歡電影{m1, m2, m3}
(3)找到與用戶A(user_id_1)具有相同電影興趣愛好的用戶群體集合Set<user_id>
如上表,可以看到,喜歡{m1, m2, m3}的用戶,除了u1,還有{u2, u3}
(4)找到該群體喜歡的電影集合Set<movie_id>
如上表,具備相同喜好的用戶群里{u2, u3},還喜好的電影集合是{m4, m5}
畫外音:“協(xié)同”就體現(xiàn)在這里。
(5)未來用戶A(use_id_1)來訪問網(wǎng)站時,要推薦電影{m4, m5}給ta。
總結(jié)
以上是生活随笔為你收集整理的基于python的电影推荐系统的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Microsoft SQL Server
- 下一篇: 转:靠谱的代码和DRY