随机交换检验数据挖掘结果-assessing data mining result via swap randomization
轉(zhuǎn)載自己的博客:?
http://blog.csdn.net/lgnlgn/article/details/5936945
? ? ?數(shù)據(jù)挖掘中一個(gè)重要的研究議題是確定發(fā)現(xiàn)的模式或模型是否顯著。雖然傳統(tǒng)統(tǒng)計(jì)方法已經(jīng)早已用以進(jìn)行顯著性檢驗(yàn),但是在數(shù)據(jù)挖掘領(lǐng)域這一方法卻沒有得到足夠的重視。在本文中提出采用隨機(jī)交換來檢驗(yàn)在0-1數(shù)據(jù)集上的數(shù)據(jù)挖掘結(jié)果。隨機(jī)交換的基本思想是:給定一個(gè)數(shù)據(jù)集D,隨機(jī)生成一批行間距(row margin)以及列間距(column margin)相同的數(shù)據(jù)集。在這些隨機(jī)數(shù)據(jù)集上進(jìn)行挖掘,看挖掘結(jié)果是否顯著不同于在原數(shù)據(jù)集上的挖掘結(jié)果。如果不是,我們可以假設(shè)挖掘結(jié)果只是由于行間距及列間距的原因,而不是數(shù)據(jù)集中的有趣結(jié)構(gòu)。
?
隨機(jī)交換的思想簡(jiǎn)單的說就是看挖掘結(jié)果是不是由特定因素造成的,套個(gè)現(xiàn)實(shí)例子:一個(gè)女孩子對(duì)你很好,你可能會(huì)覺得很幸福,但其實(shí)你不知道是她對(duì)所有人都這樣,還是對(duì)你才這樣。如果是對(duì)所有人都會(huì)好的,那她對(duì)你好其實(shí)是例行公事,沒有啥價(jià)值。 不要輕易就對(duì)一件事做一些定論,要多考察一下。
?
論文從各方面看都非常值得仔細(xì)閱讀一遍。非常推崇!
轉(zhuǎn)載于:https://www.cnblogs.com/lgnlgn/archive/2012/03/24/2416154.html
總結(jié)
以上是生活随笔為你收集整理的随机交换检验数据挖掘结果-assessing data mining result via swap randomization的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MySQL数据库添加一个字段
- 下一篇: JSONArray.fromObject