當前位置：首頁 > 编程语言 > python >内容正文

python

python打卡记录去重_Python笔记记录

發布時間：2024/9/3 python 32 豆豆

生活随笔收集整理的這篇文章主要介紹了 python打卡记录去重_Python笔记记录小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1、數據清洗檢查空值：

df[df.isna().values == True]

df = df.dropna(how='any', axis=0)

2、數據清洗去重

df1.drop_duplicates(subset=['user_id','item_id','time'],keep='first',inplace=True)

df1.info()

3、DataFrame數據的set_index() 和reset_index()set_index()

In [307]: data

Out[307]:

a b c d

0 bar one z 1.0

1 bar two y 2.0

2 foo one x 3.0

3 foo two w 4.0

In [308]: indexed1 = data.set_index('c') #單索引

In [309]: indexed1

Out[309]:

a b d

z bar one 1.0

y bar two 2.0

x foo one 3.0

w foo two 4.0

In [310]: indexed2 = data.set_index(['a', 'b'])#復合索引

In [311]: indexed2

Out[311]:

c d

a b

bar one z 1.0

two y 2.0

foo one x 3.0

two w 4.0reset_index():

reset_index可以還原索引，重新變為默認的整型索引

DataFrame.reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill=”)

level控制了具體要還原的那個等級的索引

drop為False則索引列會被還原為普通列，否則會丟失

In [318]: data

Out[318]:

c d

a b

bar one z 1.0

two y 2.0

foo one x 3.0

two w 4.0

In [319]: data.reset_index()

Out[319]:

a b c d

0 bar one z 1.0

1 bar two y 2.0

2 foo one x 3.0

3 foo two w 4.0

4、dataframe 分組并求和

#按照站點名稱分組

temp_number = data.groupby(['站點名稱']).size()

temp_number.index = ['A','B','C','D','E','F']

print(temp_number)

#篩選站點ABC的記錄并按照多個字段分別求和

data_ABC = data[(data['站點名稱']=='站點A')|(data['站點名稱']=='站點B')|(data['站點名稱']=='站點C')]

data_ABC.groupby(['站點名稱']).agg({'儀表不整':sum})#只按照一列求和

#按照多列求和

data_ABC.groupby(['站點名稱']).agg({'儀表不整':sum,'超時送達':sum,'送達不通知':sum,'提前點送達':sum,'騷擾威脅':sum,'其他':sum,'送錯餐品':sum,'態度不好':sum,'少餐/灑餐':sum})

5、dataframe列名重命名

data_A = data_A.rename(columns={'index':'原因','count':'數量'})

總結

以上是生活随笔為你收集整理的python打卡记录去重_Python笔记记录的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：闰年的判断方法_平年还是闰年？看一、二季
下一篇： python spearman相关系数_