python 计算订单_python实现apriori算法的关联规则之支持度、置信度、提升度
Apriori算法的簡介
Apriori算法:使用候選項集找頻繁項集
Apriori算法是一種最有影響的挖掘布爾關聯規則頻繁項集的算法。其核心是基于兩階段頻集思想的遞推算法。該關聯規則在分類上屬于單維、單層、布爾關聯規則。在這里,所有支持度大于最小支持度的項集稱為頻繁項集,簡稱頻集。
Apriori原理:如果某個項集是頻繁的,那么它的所有子集也是頻繁的。該定理的逆反定理為:如果某一個項集是非頻繁的,那么它的所有超集(包含該集合的集合)也是非頻繁的。Apriori原理的出現,可以在得知某些項集是非頻繁之后,不需要計算該集合的超集,有效地避免項集數目的指數增長,從而在合理時間內計算出頻繁項集。
支持度,置信度,提升度
支持度
表示同時購買X、Y的訂單數占總訂單數(研究關聯規則的“長表”中的所有購買的產品的訂單數)的比例。如果用P(X)表示購買X的訂單比例,其他產品類推,那么
置信度
表示購買X的訂單中同時購買Y的比例,即同時購買X和Y的訂單數占購買X的訂單的比例。公式表達:
提升度
提升度反映了關聯規則中的X重點內容與Y的相關性:提升度 >1 且越高表明正相關性越高;提升度 <1 且越低表明負相關性越高;提升度 =1 表明沒有相關性。
Apriori算法的編程實現
題目
數據集
要求:
從頻繁項集結果中,提取2階頻繁項集
使用seaborn工具包,實現2階頻繁項集的熱力度表示
計算2階頻繁項集的置性度(Confidence)和提升度(Lift)。定義最小置性度閾值,并生成和輸出2階關聯規則
代碼
原文地址:https://www.cnblogs.com/resource143/p/12995588.html
總結
以上是生活随笔為你收集整理的python 计算订单_python实现apriori算法的关联规则之支持度、置信度、提升度的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 农村宅基地一亩值多少钱?看完就明白了!
- 下一篇: 涵盖各种编程语言的深度学习库整理大全!