mysql置信度支持度,关于支持度和置信度的说明
支持度和置信度:
關(guān)聯(lián)規(guī)則從一個(gè)側(cè)面揭示了事務(wù)之間的某種聯(lián)系。
支持度和置信度總是伴隨著關(guān)聯(lián)規(guī)則存在的,它們是對(duì)關(guān)聯(lián)規(guī)則的必要的補(bǔ)充。
對(duì)某條關(guān)聯(lián)規(guī)則而言,如 A -> B (support=30%, confidence=
60%)
其中的support=30%是說(shuō),在所有的事務(wù)中同時(shí)出現(xiàn)A和B的概率。
而,confidence=60%是說(shuō),所有事務(wù)中,在出現(xiàn)A的情況下出現(xiàn)B的概率,即條件概率。
那么我們要怎樣設(shè)置支持度和置信度呢?
支持度揭示了A和B同時(shí)出現(xiàn)的頻率,如果A和B一起出現(xiàn)的頻率非常小,那么就說(shuō)明了A和B之間的聯(lián)系
并不大;但若一起出現(xiàn)的頻率非常頻繁,那么A和B總是相關(guān)聯(lián)的知識(shí)也許已經(jīng)成為常識(shí)而存在了。這就
涉及到如何正確設(shè)置支持度的問(wèn)題。
當(dāng)然,對(duì)數(shù)據(jù)庫(kù)中的隱藏的關(guān)聯(lián)規(guī)則的挖掘有一個(gè)重要的性質(zhì)就是知識(shí)總是出現(xiàn)在不同的層面上,
因此這也是一個(gè)需要著重考慮的問(wèn)題。
置信度揭示了A出現(xiàn)時(shí),B是否一定會(huì)出現(xiàn),如果出現(xiàn)則其大概有多大的可能出現(xiàn)。如果置信度為100%,
則說(shuō)明了A出現(xiàn)時(shí),B一定出現(xiàn)。那么,對(duì)這種情況而言,假設(shè)A和B是市場(chǎng)上的兩種商品,就沒(méi)有理由不進(jìn)行捆綁銷售了。
如果置信度太低,那么就會(huì)產(chǎn)生這樣的疑問(wèn),A和B關(guān)系并不大,也許與A關(guān)聯(lián)的并不是
B.
當(dāng)然了,就做題而言,往往給出支持度和置信度的要求。在一個(gè)具體的數(shù)據(jù)挖掘任務(wù)中,也是用戶自行設(shè)置這兩個(gè)值。
總結(jié)
以上是生活随笔為你收集整理的mysql置信度支持度,关于支持度和置信度的说明的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: git add 所有修改文件_Git管理
- 下一篇: 进腾讯实习要交钱?腾讯2021年开除70