偏度和峰度存在的意义
生活随笔
收集整理的這篇文章主要介紹了
偏度和峰度存在的意义
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
目錄
- 1 代碼
- 2 為什么要處理偏斜數據
- 3 處理偏斜數據的一些常用技術
- 4 峰度的意義
1 代碼
import scipy.stats as st st.skew(data) # 計算偏度 st.kurtosis(data) # 計算峰度2 為什么要處理偏斜數據
因為許多統計測試和機器學習模型都依賴于正態性假設。 因此,嚴重偏斜意味著數據不正常,并且可能會影響您的統計測試或機器學習預測能力。
- 如果偏度在-0.5到0.5之間,則數據是相當對稱的(正態分布);
- 如果偏斜度在-1和-0.5之間(負偏度)或0.5和1之間(正偏度),則數據偏斜;
- 如果偏斜度小于-1(負偏度)或大于1(正偏度),則數據高度偏斜;
3 處理偏斜數據的一些常用技術
在這種情況下,我們需要轉換數據以使其正常。 用于處理偏斜數據的一些常用技術:
- Log transformation
- Square root transformation
- Power transformation
- Exponential transformation
- Box-Cox transformation
- etc
4 峰度的意義
“峰度”是對實值隨機變量的概率分布的“尾部”度量。 通常用于標識給定數據集中的異常值(極值)。 由于用于識別離群值,因此使用尾部兩端的極值進行分析。
- 常態峰 Mesokurtic (峰度=3)-此分布顯示峰度3接近零。 極值(離群值)的分布與正態分布相似。
- 尖峰的 Leptokurtic (峰值>3)-這種分布顯示出比Mekokurtic更大的峰度。 該峰比中胚層更高且更尖銳。 它的兩邊都有粗尾,表明離群值較大。 在投資世界中,尖峰的發行意味著它是高風險的投資。
- 低峰態 Platykurtic:(峰值<3)-此分布顯示峰度比中側偏低。 該峰比中胚層低且寬。 它的兩側均顯示平坦的尾巴,表示離群值較小。 在投資世界中,platykurtic發行意味著它是一種低風險的投資。
總結
以上是生活随笔為你收集整理的偏度和峰度存在的意义的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 1 0.99999的悖论_宇宙年龄只有1
- 下一篇: 字符串常见方法总结: 构造方法、静态方法