常见分数值归一化方法
生活随笔
收集整理的這篇文章主要介紹了
常见分数值归一化方法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
數據標準化(歸一化)處理是數據挖掘的一項基礎工作,不同評價指標往往具有不同的量綱和量綱單位,這樣的情況會影響到數據分析的結果,為了消除指標之間的量綱影響,需要進行數據標準化處理,以解決數據指標之間的可比性。原始數據經過數據標準化處理后,各指標處于同一數量級,適合進行綜合對比評價。以下是兩種常用的歸一化方法:
一、min-max標準化(Min-Max Normalization)
也稱為離差標準化,是對原始數據的線性變換,使結果值映射到[0 – 1]之間。轉換函數如下:
x?=(x?min)/(max?min)
其中max為樣本數據的最大值,min為樣本數據的最小值。這種方法有個缺陷就是當有新數據加入時,可能導致max和min的變化,需要重新定義。
二、Z-score標準化方法
這種方法給予原始數據的均值(mean)和標準差(standard deviation)進行數據的標準化。經過處理的數據符合標準正態分布,即均值為0,標準差為1,轉化函數為:
x?=(x?μ)/σ
其中?μ為所有樣本數據的均值,σ為所有樣本數據的標準差。
三 Z-scores 簡單化
模型如下:
x?=1/(1+x)
x越大證明x??越小,這樣就可以把很大的數規范在[0-1]之間了。
總結
以上1,2方法都需要依賴樣本所有數據,而3方法只依賴當前數據,可以動態使用,好理解。
轉載:https://www.cnblogs.com/swg1124/p/7028054.html
總結
以上是生活随笔為你收集整理的常见分数值归一化方法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ns2相关学习——tcl脚本编写(1)
- 下一篇: python机器学习常用包