基于python的电影推荐系统论文_一种电影推荐系统的设计与实现
設計制作
數碼世界 P
.118
一種電影推薦系統的設計與實現
張博 李昂松 尹琛 湖北大學
摘要
:隨著網絡的發展,人們在大數據中尋找自己所需信息的成本越來越高。由于用戶對于自己真實需求的模糊性和想得到符合個人
喜好的結果的需求,催生出了推薦系統。本文根據
600
個用戶對
9000
部電影的
10000
項評價,通過對各大網站的電影評分系統和電影推
薦系統的研究,采用基于物品的協同過濾算法和奇異值分解法(SVD)分別建立電影排名計算模型和電影推薦系統,為用戶提供個性化的
推薦服務。
關鍵詞
:協同過濾 SVD 推薦系統
1 問題背景與提出
隨著網絡的發展及移動端的普及,
越來越多的人們接觸到了網絡,
截至
2018
年
6
月,
我國網民人數已破
8
億。
用戶在海量的數據中想
要查找到所需信息越來越難,
推薦系統應運而生。
它通過分析用戶的
歷史行為
,
向用戶推薦能夠滿足他們興趣和需求的信息
,
建立平臺
與用戶之間的密切關系
, 提高用戶的滿意度。
本文現根據
600
個用戶對
9000
部電影的
10000
項評價
,
包括電
影信息、
用戶對電影的評分等數據,
建立數學模型解決以下問題:
(1)
建立數學模型,
實現電影推薦系統,
以便對用戶進行電影推薦。
(2)
建立合理的指標體系評價你所建立的推薦系統。
2 模型的建立與求解
在求解前,
為
了
合理簡化模型,
現做出假設:
(1)
每個用戶的評分可以反映電影的優劣程度,
保證用戶評分的
合理性;
(2)
用戶的喜好在一定時間范圍內是不變的,
此假設保證模型的
可信性;
2.
1
問題一
2.
1.
1
簡單數據分析
已有數據中包含評分電影年份和評分提交時間等信息,
本文從
評分的出現頻數、
電影發行情況與時間的關系以及評論時間的關系入
手進行簡單分析.
(1)
電影數量與時間的關系
利用
EXCEL
統計出自
1902
年開始到
2018
年每一年的電
影數
量,
并對統計結果做透視分析。
結果表明,
全球電影數量自
1973
年
(65
部)
開始增速加快,
數量增長趨勢成指數型,
到
2002
年時達到最大
值,
為
324
部,
此后增速放緩且每年電影數量整體上有下降的態勢但
仍舊能夠保持每年
160
部及以上的電影數量。
(2)
電影評價與年份的關系
利用
EXCEL
軟件,
統計出自
1970
年開始到
2018
年每一年的評
價數量,
并對統計結果做透視分析。
結果表明,
全球用戶對電影的評
論數量由
1980
年
(879
條)
開始出現顯著增加,
每年評論數量呈現指
數式增長,
這與上世紀八十年代開始互聯網的普及與個人電腦
PC
進
入尋常百姓家中有很大的關系;
評論數量在
1995
年達到最大值
(6012
條)
,
此后開始急劇跌落。
結合兩次分析的結果可以發現,
1994
年至
2015
年間電影數量相差不會很大。
但在這
21
年中,
1994
年到
2004
年間的電影評論數遠高于其他年份,
說明在這
20
年間人們對電影的
關注度非常高,
且
1994~1995
年可以視為電影的鼎盛時期,
這與電影
的
“黃金年代”
的時間大致符合
總結
以上是生活随笔為你收集整理的基于python的电影推荐系统论文_一种电影推荐系统的设计与实现的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 《java设计模式》之责任链模式
- 下一篇: OpenDDS简单示例,轻松入门