特征工程(3):特征选择
生活随笔
收集整理的這篇文章主要介紹了
特征工程(3):特征选择
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
? ? ? ? 在建立模型之前,我們已經按照特征構建的方法得到了數據集,但是這樣的數據集可能存在大量的特征,特征之間可能存在相關性,也可能存在冗余特征,因此需對數據集進行降維處理,以得到最優子集,這個過程叫做特征選擇。
? ? ? ?特征選擇的常用方法通常可分為三類:直接法、單變量特征選擇、多變量特征選擇。
? ? ? ?1. 直接法
? ? ? ?2. 單元法
? ? ? ? ? ?2.1 相關系數
? ? ? ? ? ?2.2 信息增益
? ? ? ? ? ?2.3 Gini系數
? ? ? ? ? ?2.4 單因素方差分析
? ? ? ? ? ?2.5 卡方檢驗
? ? ? ?3. 多元法
? ? ? ? ? ?3.1 逐步回歸
? ? ? ? ? ?3.2 隨機森林
? ? ? ? ? ?3.3 遺傳算法
單元法:即單變量,對每個特征依次進行評價,然后把不滿足要求的排除,以達到特征選擇的目的。
多元法:即多變量,一次針對多個變量,通過評價各個組合的得分,最終選擇最優的特征組合,作為多變量特征選擇的結果。
總結
以上是生活随笔為你收集整理的特征工程(3):特征选择的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 卡尔曼滤波器算法(Kalman Filt
- 下一篇: 特征工程(3):特征选择—信息增益