pandas删除满足条件的行_入门Pandas练习
本節主要是自己學習pandas的練習,與你分享。
導入Pandas與NumPy
import numpy as np import pandas as pd生成Series時,pandas默認生成整數索引,我們嘗試一下。
s = pd.Series([23,2,5,np.nan,6,9]) s使用時間索引與含有標簽的Numpy數組生成DataFrame
dates = pd.date_range('20200101',periods=7) dates使用隨機數生成一個7*4的數據表。
使用Series字典生成DataFrame
df2 = pd.DataFrame({'A':1.2,'B':pd.Series(1,index=list(range(4)),dtype='float32'),'C':pd.Timestamp('20200101'),'D':np.array([3]*4,dtype='int32'),'E':pd.Categorical(["test","tarin","test","train"]),'F':'foo'}) df2我們查看一下df2中每列的數據類型
df2.dtypes下面進入數據查看環節,查看數據的前幾行和結尾幾行的數據:
df.head()#默認是5行df.head(3)#可以輸入數字查看相應行數df.tail(3)#查看最后3行顯示索引與列名
快速的查看數據統計概要:
數據轉置:
提取數據
獲取單列數據,選擇單列,產生Series,與df.A 等效
使用[ ]切片:
按標簽選擇,用標簽提取一行數據
用標簽選擇多列數據
用標簽切片,包含行與列結束點:
提取標量值:
使用整數位置選擇
類似 NumPy / Python,用整數切片:
顯示整行的切片:
顯示整列的切片:
布爾索引,用單列的值選擇數據:
提取出DataFrame 里滿足條件的值:
使用isin篩選:
用索引自動對齊新增列的數據:
按標簽賦值:
按位置賦值
按 NumPy 數組賦值:
Pandas 主要用 np.nan 表示缺失數據,計算時,默認不包含空值。 重建索引(reindex)可以更改、添加、刪除指定軸的索引,并返回數據副本,即不更改原數據。
刪除所有包含空值的行:
填充缺失值:
計算均值:
數值計數:
包含的字符串的處理功能str:
數據合并,pandas 提供了多種將 Series、DataFrame 對象組合在一起的功能,用索引與關聯代數功能的多種設置邏輯可執行連接(join)與合并(merge)操作。
為 DataFrame 追加行:
分組,“group by” 指的是涵蓋下列一項或多項步驟的處理流程:
分割:按條件把數據分割成多組;
應用:為每組單獨應用函數;
組合:將處理結果組合成一個數據結構。
先分組,再用 sum()函數計算每組的匯總數據:
多列分組后,生成多層索引,也可以應用 sum 函數:
以上為學習所得,希望對你有幫助。
總結
以上是生活随笔為你收集整理的pandas删除满足条件的行_入门Pandas练习的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 海外保险优势和劣势
- 下一篇: 查找字符位置_EXCEL函数公式大全之利