python打卡记录去重_Python笔记记录
1、數據清洗檢查空值:
df[df.isna().values == True]
df = df.dropna(how='any', axis=0)
2、數據清洗去重
df1.drop_duplicates(subset=['user_id','item_id','time'],keep='first',inplace=True)
df1.info()
3、DataFrame數據的set_index() 和reset_index()set_index()
In [307]: data
Out[307]:
a b c d
0 bar one z 1.0
1 bar two y 2.0
2 foo one x 3.0
3 foo two w 4.0
In [308]: indexed1 = data.set_index('c') #單索引
In [309]: indexed1
Out[309]:
a b d
c
z bar one 1.0
y bar two 2.0
x foo one 3.0
w foo two 4.0
In [310]: indexed2 = data.set_index(['a', 'b'])#復合索引
In [311]: indexed2
Out[311]:
c d
a b
bar one z 1.0
two y 2.0
foo one x 3.0
two w 4.0reset_index():
reset_index可以還原索引,重新變為默認的整型索引
DataFrame.reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill=”)
level控制了具體要還原的那個等級的索引
drop為False則索引列會被還原為普通列,否則會丟失
In [318]: data
Out[318]:
c d
a b
bar one z 1.0
two y 2.0
foo one x 3.0
two w 4.0
In [319]: data.reset_index()
Out[319]:
a b c d
0 bar one z 1.0
1 bar two y 2.0
2 foo one x 3.0
3 foo two w 4.0
4、dataframe 分組 并 求和
#按照站點名稱分組
temp_number = data.groupby(['站點名稱']).size()
temp_number.index = ['A','B','C','D','E','F']
print(temp_number)
#篩選站點ABC的記錄并按照多個字段分別求和
data_ABC = data[(data['站點名稱']=='站點A')|(data['站點名稱']=='站點B')|(data['站點名稱']=='站點C')]
data_ABC.groupby(['站點名稱']).agg({'儀表不整':sum})#只按照一列求和
#按照多列求和
data_ABC.groupby(['站點名稱']).agg({'儀表不整':sum,'超時送達':sum,'送達不通知':sum,'提前點送達':sum,'騷擾威脅':sum,'其他':sum,'送錯餐品':sum,'態度不好':sum,'少餐/灑餐':sum})
5、dataframe列名重命名
data_A = data_A.rename(columns={'index':'原因','count':'數量'})
總結
以上是生活随笔為你收集整理的python打卡记录去重_Python笔记记录的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 闰年的判断方法_平年还是闰年?看一、二季
- 下一篇: python spearman相关系数_