欧氏距离、规范化欧氏距离=L2normal规范化平方和/模=1、softmax归一化和=1、z-sorce标准化(变化范围0~1,和不为1
距離解釋https://blog.csdn.net/weixin_42056745/article/details/80583707
先L2歐氏距離
歸一化和規范化使用情況
1、在分類、聚類算法中,需要使用距離來度量相似性的時候、或者使用PCA技術進行降維的時候,標準化(Z-score standardization)表現更好,可消除各個維度上的差異
2、在不涉及距離度量、協方差計算、數據不符合正太分布的時候,可以使用歸一化方法。比如圖像處理中,將RGB圖像轉換為灰度圖像后將其值限定在[0 255]的范圍
一、歐式、L2規范化歐氏距離、softmax歸一化和=0
規范化:
針對數據庫
規范化把關系滿足的規范要求分為幾級,滿足要求最低的是第一范式(1NF),再來是第二范式、第三范式、BC范式和4NF、5NF等等,范數的等級越高,滿足的約束集條件越嚴格。
針對數據;規范化:按比例縮放
數據的規范化包括歸一化、標準化、正則化,其實都是誤稱(統稱(也有人把標準化作為統稱))
數據規范化是數據挖掘中的數據變換的一種方式,數據變換將數據變換或統一成適合于數據挖掘的形式,將被挖掘對象的屬性數據按比例縮放,使其落入一個小的特定區間內,如[-1, 1]或[0, 1]
對屬性值進行規范化常用于涉及神經網絡和距離度量的分類算法和聚類算法當中。比如使用神經網絡后向傳播算法進行分類挖掘時,對訓練元組中度量每個屬性的輸入值進行規范化有利于加快學習階段的速度。對于基于距離度量相異度的方法,數據歸一化能夠讓所有的屬性具有相同的權值。
數據規范化的常用方法有三種:最小最大值規范化,z-score標準化和按小數定標規范化
標準化 z-sorce 0均值化/方差,可正負,但是絕對值不大也不一定=1,視數據的分布最大最小值影響
數據標準化是將數據按比例縮放,使其落入到一個小的區間內,標準化后的數據可正可負,但是一般絕對值不會太大,一般是z-score標準化方法:減去期望后除以標準差。
特點:
對不同特征維度的伸縮變換的目的是使其不同度量之間的特征具有可比性,同時不改變原始數據的分布。
好處:
歸一化(改變原始分布不同維度伸縮)vs標準化(伸縮不改變數據分布)
歸一化: 在不同維度數據進行不同的伸縮變化
如下:機器學習中梯度下降加快收斂
總結
以上是生活随笔為你收集整理的欧氏距离、规范化欧氏距离=L2normal规范化平方和/模=1、softmax归一化和=1、z-sorce标准化(变化范围0~1,和不为1的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 物联网学习笔记(摘录)
- 下一篇: python接口自动化:自动获取cook