数学建模——数据分析方法
生活随笔
收集整理的這篇文章主要介紹了
数学建模——数据分析方法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
一、常見數據分析軟件
Excel(office三件套之一)、R語言、Eviews、origin(圖形分析工具)、SPSS(統計分析與數據挖掘)
MATLAB(墻裂推薦)、python(墻裂推薦)、SAS
二、統計性描述
(與傳統的方差不同,這里除以的是n-1)
sk=1n∑i=1n(xi?xˉ)3s3s_{k}=\frac{\frac{1}{n} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{3}}{s^{3}}sk?=s3n1?∑i=1n?(xi??xˉ)3?
三、數據的預處理
- 刪掉這條數據:df.dropna(axis=0,how="any",inplace=False)
- 用均值填充:
- 用中位數來填補
- 用眾數來填補
最大最小值標準化和均值標準化
xi′=xi?xmin?xmax??xmin?xi′=xi?xsx_{i}^{\prime}=\frac{x_{i}-x_{\min }}{x_{\max }-x_{\min }} \quad x_{i}^{\prime}=\frac{x_{i}-x}{s}xi′?=xmax??xmin?xi??xmin??xi′?=sxi??x? # 最大最小值標準化def max_min_std(data):m_max = data.max(axis=0)m_min = data.min(axis=0)data = (data - m_min)/(m_max-m_min)return data#均值標準化def mean_std(data):m_mean = data.mean(axis=0)m_std = data.std(axis=0)data = (data - m_mean)/m_stdreturn data
四、相關性分析
1. pearson相關系數(df.corr(method = )):
r=∑i=1n(xi?xˉ)(yi?yˉ)∑i=1n(xi?xˉ)2∑i=1n(yi?yˉ)2r=\frac{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)}{\sqrt{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2} \sum_{i=1}^{n}\left(y_{i}-\bar{y}\right)^{2}}}r=∑i=1n?(xi??xˉ)2∑i=1n?(yi??yˉ?)2?∑i=1n?(xi??xˉ)(yi??yˉ?)?
2. spearman,kendall相關系數
1. 當R>0時,正相關,R<0時,負相關
2. R的絕對值越接近1,表示兩個變量越接近線性關系
3. R的絕對值越接近0,表示兩個變量越沒有相關系
4. R的絕對值大于0.8時,視為高度相關
5. R的絕對值介于0.5~0.8時,視為中度相關
6. R的絕對值小于0.3時,視為不相關
五、回歸分析
y=β0+β1x1+β2x2+…+βpxp+εy=\beta_{0}+\beta_{1} x_{1}+\beta_{2} x_{2}+\ldots+\beta_{p} x_{p}+\varepsilony=β0?+β1?x1?+β2?x2?+…+βp?xp?+ε
其中的βi\beta_{i}βi?是回歸系數
總結
以上是生活随笔為你收集整理的数学建模——数据分析方法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 华南理工计算机电路基础试题,华南理工计算
- 下一篇: java开源社区 推荐_13 个最火的