机器学习之数据预处理——数据清洗(缺失值、异常值和重复值的处理)
生活随笔
收集整理的這篇文章主要介紹了
机器学习之数据预处理——数据清洗(缺失值、异常值和重复值的处理)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
機器學習之數據預處理——數據清洗缺失值、異常值和重復值的處理
- 基礎知識
- 技術點總結
- 數據列缺失的處理方法
- 1、丟棄(缺失值處理)
- 1、生成一份隨機數據
- 2、查看哪些值缺失
- 3、獲得含有NA的列
- 4、獲取全部為NA的列
- 5、丟棄缺失值
- 2、補全(缺失值處理)
- 1、使用sklearn將缺失值替換為特定值
- 使用這一列的均值代替NaN
- 使用這一列的中位數代替NaN
- 使用這一列的眾數代替NaN
- 2、使用Pandas將缺失值替換為特定值
- 用后面的值替換缺失值
- 用后面的值替換缺失值,限制每列只能替換一個缺失值
- 用前面的值替換缺失值
- 用0替換缺失值
- 用不同值替換不同列的
總結
以上是生活随笔為你收集整理的机器学习之数据预处理——数据清洗(缺失值、异常值和重复值的处理)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 全球首个商用海底数据中心成功下水安装 重
- 下一篇: 墨子巡天望远镜发现首批近地小行星