月均数据_利用Python进行数据分析(附详细案例)
一、前期準備
分析要用到兩個包:NumPy和Pandas,首先確保jupyter中成功安裝了這兩個包。
#導入numpy包 import numpy as np #導入pandas包 import pandas as pd二、基礎知識
2.1 一維數據分析:NumPy
2.2 一維數據結構:Pandas
2.3 二維數據分析:numpy對應array
2.4 二維數據分析:pandas對應數據框DateFrame
此處遇到一個問題:讀取Excel文件報錯。
解決方法:
1 查看Excel文件存放路徑
具體操作:點擊文件名,鼠標右鍵,選擇“屬性”,找到下面標紅的兩個地方。
2 將上面標紅的兩處合成文件的路徑,
格式為文件夾文件名,比如F:annUntitled1.ipynb
3 最后把路徑中全部的斜杠(/)或者反斜杠()替換為雙反斜杠()
最后的路徑為F:annUntitled1.ipynb
三、Python具體案例分析:藥店銷售數據
3.1 提出問題
分析指標:
- 月均消費次數
- 月均消費金額
- 客單件
- 消費趨勢
3.2 理解數據
3.3 清洗數據
3.3.1 選擇子集
3.3.2 列名重命名
3.3.3 缺失數據處理(dropna()函數)
Python缺失值有3種:None,NA,NaN。(分析數據時,如果遇到什么錯誤,比如float錯誤,就要考慮是否為缺失值,若是,則需要處理掉)。
None和NaN的區別:None是Python的一種數據類型(NoneType),NaN是浮點類型(float),兩個都用作空值。
3.3.4 數據類型轉換
3.3.5 數據排序
3.3.6 異常值處理
3.4 構建模型
3.4.1 指標1:月均消費次數=總消費次數/月份數
3.4.2 指標2:月均消費金額=總消費金額/月份數
3.4.3 指標3:客單價=總消費金額/總消費次數
客單價(per customer transaction):商場(超市)每位顧客平均購買商品的金額,即是平均交易金額。
3.4.3 消費趨勢
End.
總結
以上是生活随笔為你收集整理的月均数据_利用Python进行数据分析(附详细案例)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 避免流量高峰期CDN问题的10个方法
- 下一篇: 初识react(二) 实现一个简版的ht