亲和性分析_0(python数据挖掘入门与实践-实验1)
文章目錄
- 解析
- 思路
- 效果
- 代碼
解析
支持度:事件發(fā)生的總次數(shù)
置信度:一定條件下,事件發(fā)生的概率
思路
第一步:
導(dǎo)入數(shù)據(jù),并交由變量X維護
創(chuàng)建特征數(shù)組
獲取特征數(shù)量
第二步:
創(chuàng)建字典
valid_rules:(a,b):num_i的含義
表示買商品 a 之后,又買了商品 b 的消費者數(shù)量
invalid_rules:(a,b):num_i的含義
表示買商品 a 之后,沒有買了商品 b 的消費者數(shù)量
nums_occurances:(a):num_i的含義
表示買商品 a 的消費者數(shù)量
第三步:
遍歷 X 每 i 行
primise表示前提,conclusion表示結(jié)論
(X [i] [primise])=(1):表示消費者 i 買features[primise]
(X [i] [primise], X [i] [conclusion])=(1,0):表示消費者 i 買features[primise]之后, 沒買了features[conclusion]
(X [i] [primise], X [i] [conclusion])=(1,1):表示消費者 i 買features[primise]之后, 還買了features[conclusion]
若(X [i] [primise])=(1),則nums_occurances(primise)+1
若(X [i] [primise], X [i] [conclusion])=(1,0),則invalid_rules(primise,conclusion)+1
若(X [i] [primise], X [i] [conclusion])=(1,1),則valid_rules(primise,conclusion)+1
遍歷完成
第四步:
由valid_rules定義可得
支持度=valid_rules
置信度=(1, 1)發(fā)生的次數(shù) / ((1, 1)發(fā)生的次數(shù)+(1, 0)發(fā)生的次數(shù))
效果
代碼
#庫導(dǎo)入 import numpy as np from collections import defaultdict#導(dǎo)入數(shù)據(jù) dataset_filename="D:/Python/Jupyter/Learning-Data-Mining-with-Python-master/Chapter 1/affinity_dataset.txt" X=np.loadtxt(dataset_filename) features=['bread','milk','cheese','apple','banana'] nums_feature=len(X[0])#遍歷數(shù)據(jù) valid_rules=defaultdict(int) invalid_rules=defaultdict(int) nums_occurances=defaultdict(int) for sample in X:for primise in range(nums_feature):if sample[primise]==0: continuenums_occurances[primise]+=1for conclusion in range(nums_feature):if conclusion==primise: continueif sample[conclusion]==1: valid_rules[(primise,conclusion)]+=1else: invalid_rules[(primise,conclusion)]+=1#支持度 support=valid_rules #置信度 confidence=defaultdict(float) for primise,conclusion in valid_rules.keys():confidence[(primise,conclusion)]=valid_rules[(primise,conclusion)]/nums_occurances[primise]#結(jié)果展示 for primise,conclusion in confidence.keys():print("Rule: If a people buys {0} they will also buy {1}".format(features[primise],features[conclusion]))print("- Support: {0}".format(confidence[(primise,conclusion)]))print("- Confidence: {0}".format(support[(primise,conclusion)]))總結(jié)
以上是生活随笔為你收集整理的亲和性分析_0(python数据挖掘入门与实践-实验1)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Leetcode题库 19.删除链表的倒
- 下一篇: 数据挖掘-亲和性分析函数(通用)