数据科学与大数据分析项目练习-3将Apriori算法应用于R中提供的“Groceries”数据集
生活随笔
收集整理的這篇文章主要介紹了
数据科学与大数据分析项目练习-3将Apriori算法应用于R中提供的“Groceries”数据集
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
R語言Apriori算法
- 項目要求:
- Project Start
- **規則生成和可視化**
我們需要安裝arules and arulesViz包。
項目要求:
生成頻繁項目集滿足下面條件:
– The minimum support threshold as 0.02
– The minimum length of the itemsets as 1
– The maximum length of the itemsets as 10
生成的關聯規則滿足下面條件:
– The minimum support threshold as 0.001
– The minimum confidence threshold as 0.6
Project Start
# 下載并加載相關的包(可能需要梯子) install.packages('arules') install.packages('arulesViz') library('arules') library('arulesViz') # 讀取并展示“Groceries”包 data(Groceries) Groceries summary(Groceries) class(Groceries)
可以看到這個“Groceries”包一共有9835行和169列。
接下來是生成頻繁項目集
參數的設置按照要求
生成的頻繁項目集結果如下:
規則生成和可視化
rules <- apriori(Groceries, parameter=list(support=0.001,confidence=0.6, target = "rules")) summary(rules) plot(rules) plot(rules@quality) # 顯示rules與最高lift scores inspect(head(sort(rules, by="lift"), 10))
篩選出置信度大于0.9的rules
一個127個,之后polt成為matrix得到
得到圖片如下所示。
從圖中我們可以得到買火腿的基本上都會購買加工芝士,買爆米花或者soda飲料的很大概率會購買咸味小吃。
參考書目
總結
以上是生活随笔為你收集整理的数据科学与大数据分析项目练习-3将Apriori算法应用于R中提供的“Groceries”数据集的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机镜像怎么恢复,教你如何在win7系
- 下一篇: IOS开发之开发工具Xcode下载