几种常用的数据校验(异常检测)总结(3σ、肖维勒准则、狄克逊准则、格拉布斯准则、皮尔士准则、卡方检验、T检验等等)
生活随笔
收集整理的這篇文章主要介紹了
几种常用的数据校验(异常检测)总结(3σ、肖维勒准则、狄克逊准则、格拉布斯准则、皮尔士准则、卡方检验、T检验等等)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
對統計數據分析,異常數據檢測以及排除時,主要有兩種方法:物理判別法和統計判別法
- 物理判別法:人們對客觀事物已有的認識,判別由于外界干擾、人為誤差等原因造成實測數據值偏離正常結果,在實驗過程中隨時判斷,隨時剔除。
- 統計判別法:給定一個置信概率,并確定一個置信限,凡超過此限的誤差,就認為它不屬于隨機誤差范圍,將其視為異常值剔除。當物理識別不易判斷時,一般采用統計識別法。
?
數據預測檢測和處理系列文章
- 拉依達準則( PauTa Criterion 或 3σ準則) 處理異常數據
- 肖維勒準則(Chauvenet Criterion)處理異常數據
- 狄克遜準則(Dixon Criterion)處理異常數據
- 格拉布斯準則(Grubbs Criterion)處理數據異常
- 皮爾士準則(Peirce Criterion)處理異常數據
- 卡方檢驗(chi-squared test)處理異常數據
- T檢驗或T測試(T-test)
- Scikit-learn實現隔離森林(Isolation Forest)算法進行異常值檢測
- Scikit-learn實現局部異常因子(LOF)的無監督異常值檢測
- 異常檢測方法
- 隔離森林(Isolation Forest)算法
以上文章都可以在本人的Big Data Analysis文章類別里找到,是本人精心匯總的知識,感謝大家閱讀,有錯誤歡迎指出。
后續會增加該系列文章。
總結
以上是生活随笔為你收集整理的几种常用的数据校验(异常检测)总结(3σ、肖维勒准则、狄克逊准则、格拉布斯准则、皮尔士准则、卡方检验、T检验等等)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C语言实训设计——疫情健康打卡系统
- 下一篇: 【CFD学习】网格无关性验证