数据预处理——数据清洗、异常值与重复数据的检测
生活随笔
收集整理的這篇文章主要介紹了
数据预处理——数据清洗、异常值与重复数据的检测
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
數(shù)據(jù)預(yù)處理(Data Preprocessing)
Where are data from?
Why Data Preprocessing?
How to handle missing data?
Outliers
? ? ? ? ? ? ??
注:異常點(diǎn)(Anomaly) vs. 離群點(diǎn)(Outlier)是不一樣的
怎么分析離群點(diǎn)(Local Outlier Factor)—— 用相對(duì)的關(guān)系
處理重復(fù)的數(shù)據(jù)(Duplicate Data)
方法一:用滑動(dòng)窗口去做
方法二:找兩者關(guān)鍵的相同點(diǎn)
總結(jié)
以上是生活随笔為你收集整理的数据预处理——数据清洗、异常值与重复数据的检测的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 以不同的维度去看待问题
- 下一篇: 离群点检测算法——LOF(Local O