数据挖掘(一)A-Priori
生活随笔
收集整理的這篇文章主要介紹了
数据挖掘(一)A-Priori
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
數(shù)據(jù)挖掘需要挖掘事物之間的關聯(lián)性,A-Priori是一個購物籃模型,實質上是一個教你快速統(tǒng)計頻繁項集的方法,其根據(jù)頻繁項集的單調性,來減少掃描的次數(shù)
比如我有很多購物籃,每個籃子里有若干物品,如{青菜,黃瓜}{黃瓜,蘑菇,冬筍}{面條,醬油}{苗條,青菜}
我要推斷那些物品會同時出現(xiàn),這樣方便推薦,或者說我能發(fā)現(xiàn)哪些物品之間有一定的關聯(lián)性;A-Priori就是干這個的
這個算法比較簡單,就是一個掃描計數(shù)的過程,但是有兩點,
1)是要將物品編碼,便于節(jié)省空間;
2)是K+1頻繁項集的尋找要建立在K頻繁項集合的基礎上,比如我要找一個3頻繁項集合,那么我可以推斷,這3個項的任意兩項組合必然在之前找到的2頻繁項集合中;
及時踢掉一些不可能成為頻繁項集的成分,減少掃描次數(shù);
凡是數(shù)據(jù)挖掘的算法重點不是在流程,而是在如何優(yōu)化過程,因為減少一步都能帶來巨大的效率,如何處理大數(shù)據(jù)!
總結
以上是生活随笔為你收集整理的数据挖掘(一)A-Priori的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: QT移植多点触控
- 下一篇: html万花筒图片轮播代码,jQuery