Pandas简明教程:五、Pandas简单统计操作及通用方式
文章目錄
- 1、DataFrame的方法使用舉例
- 2、DataFrame的方法調用通用方式
- 3、DataFrame直接調用其它方法
- 本系列教程教程完整目錄:
前面已經提到,Pandas的DataFrame本質上其實就是一個表。對應Excel,我們通常會用到各種統計方法。那么這篇教程就簡單敘述一下Pandas中基本的統計方法以及通用的調用規則。
1、DataFrame的方法使用舉例
DataFrame中封裝了許多方便查看的方法,比如:
- 查看首尾
當然還可以在方法中輸入數字,表示查看前幾行和后幾行。
2、DataFrame的方法調用通用方式
從上面的例子可以看到,DataFrame在調用方法時就是在最后加入.+方法名即可。另外也注意到,這種方式返回的類型仍然是一個DataFrame。事實上在調用這些方法時,這些方法的作用域通常是對每一列進行作用,比如:
df.max()月份 5 姓名 王五 性別 男 應發工資 2000 實發工資 15000 職位 龍套 dtype: objectdf.min()月份 1 姓名 張三 性別 女 應發工資 1800 實發工資 1000 職位 主犯 dtype: object結合原表,很容易看到實際上返回的值是對每一例取最大或者最小再返回的。而此時返回的值是一個Series,原來的表頭變成了Index。
那么對應的,我們其實也可以猜到一些用法,比如求平均、中位數等等:
df.mean()月份 3.000000 應發工資 1866.666667 實發工資 2376.923077 dtype: float64df.median()月份 3.0 應發工資 1800.0 實發工資 1300.0 dtype: float64并且有意思的是,這些方法會自動選擇可以進行操作的列。比如這里就只返回了數值列的平均和中位數。
類似的方法還有很多,這里就不一一列舉,具體使用時可以參考:Pandas中DataFrame的屬性及方法大全
3、DataFrame直接調用其它方法
這里再重點介紹一個方法apply,該方法是將函數直接傳入DataFrame并沿指定的方向進行計算,比如
df.apply(np.max)月份 5 姓名 王五 性別 男 應發工資 2000 實發工資 15000 職位 龍套 dtype: object這里默認是按列操作,如果要換成按行操作則可以設置參數axis=1。
不過對這們這組數據,直接按行操作會出現樣的問題:
df.apply(np.max,axis=1) --------------------------------------------------------------------------- TypeError Traceback (most recent call last) <ipython-input-186-956304eff83f> in <module> ----> 1 df.apply(np.max,axis=1)TypeError: '>=' not supported between instances of 'int' and 'str'錯誤說大于等于比較不能作用于整數和字符串。所以在使用時要注意事先檢查該函數是否能應用于想作用的區域。
本系列教程教程完整目錄:
一、Pandas簡介與安裝
二、Pandas基本數據結構-DataFrame與Series
三、Pandas文件讀寫
四、Pandas數據索引方式
五、Pandas簡單統計操作及通用方式
六、Pandas條件查詢
七、Pandas缺失數據的處理(數據清洗基礎)
八、Pandas數據透視表
九、表的合并、連接、拼接(數據聚合基礎)
《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀總結
以上是生活随笔為你收集整理的Pandas简明教程:五、Pandas简单统计操作及通用方式的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Pandas中DataFrame的属性及
- 下一篇: Pandas简明教程-适用于竞赛、研究以