数据预处理的方法有哪些(夜间灯光数据预处理)
本教程操作環(huán)境:windows7系統(tǒng)、Dell G3電腦。
數(shù)據(jù)預處理(data preprocessing)是指在主要的處理以前對數(shù)據(jù)進行的一些處理。如對大部分地球物理面積性觀測數(shù)據(jù)在進行轉(zhuǎn)換或增強處理之前,首先將不規(guī)則分布的測網(wǎng)經(jīng)過插值轉(zhuǎn)換為規(guī)則網(wǎng)的處理,以利于計算機的運算。另外,對于一些剖面測量數(shù)據(jù),如地震資料預處理有垂直疊加、重排、加道頭、編輯、重新取樣、多路編輯等。
數(shù)據(jù)預處理的方法
1、數(shù)據(jù)清理
通過填寫缺失的值、光滑噪聲數(shù)據(jù)、識別或刪除離群點并解決不一致性來“清理”數(shù)據(jù)。主要是達到如下目標:格式標準化,異常數(shù)據(jù)清除,錯誤糾正,重復數(shù)據(jù)的清除。
2、數(shù)據(jù)集成
數(shù)據(jù)集成例程將多個數(shù)據(jù)源中的數(shù)據(jù)結(jié)合起來并統(tǒng)一存儲,建立數(shù)據(jù)倉庫的過程實際上就是數(shù)據(jù)集成。
3、數(shù)據(jù)變換
通過平滑聚集,數(shù)據(jù)概化,規(guī)范化等方式將數(shù)據(jù)轉(zhuǎn)換成適用于數(shù)據(jù)挖掘的形式。
4、數(shù)據(jù)歸約
數(shù)據(jù)挖掘時往往數(shù)據(jù)量非常大,在少量數(shù)據(jù)上進行挖掘分析需要很長的時間,數(shù)據(jù)歸約技術可以用來得到數(shù)據(jù)集的歸約表示,它小得多,但仍然接近于保持原數(shù)據(jù)的完整性,并結(jié)果與歸約前結(jié)果相同或幾乎相同。
數(shù)據(jù)預處理是數(shù)據(jù)挖掘一個熱門的研究方面,畢竟這是由數(shù)據(jù)預處理的產(chǎn)生背景所決定的--現(xiàn)實世界中的數(shù)據(jù)幾乎都臟數(shù)據(jù)。
更多相關知識,請訪問常見問題欄目!
以上就是數(shù)據(jù)預處理的方法有哪些的詳細內(nèi)容,更多請關注風君子博客其它相關文章!
總結(jié)
以上是生活随笔為你收集整理的数据预处理的方法有哪些(夜间灯光数据预处理)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 向日葵软件是干什么用的(像向日葵一样的博
- 下一篇: excel表格乘法计算方法