pandas操作1(读csv不要索引/写csv不要索引/删除有空值行/按时间排序)
pandas常用csv操作
- 讀csv不要索引(index)
- 寫(xiě)csv不要索引
- 刪除有空值的行
- 按時(shí)間排序
- 其他操作
讀csv不要索引(index)
在使用pandas讀csv(read_csv())時(shí),會(huì)默認(rèn)產(chǎn)生一列索引,當(dāng)你要把處理過(guò)后的csv文件生成一個(gè)新的csv文件時(shí),就會(huì)多出一列索引值且這一列沒(méi)有名字,不方便通過(guò)drop(columns=[‘name’])來(lái)刪除,可以一開(kāi)始在讀的時(shí)候就讓它不要產(chǎn)生索引(index_col=0)。
df = pd.read_csv('filename.csv', encoding='utf-8', index_col=0)寫(xiě)csv不要索引
同樣在生成csv文件時(shí)(to_scv())也可以避免生成索引列,方法為添加參數(shù)(index=False)
df.to_csv('C:/filepath/xxx.csv', index=False)刪除有空值的行
做數(shù)據(jù)分析的時(shí)候遇到有的行的某個(gè)關(guān)鍵值為空,那最好刪除掉一整行以免影響后面的操作。
df1 = df.dropna(subset=['列名'])按時(shí)間排序
有的數(shù)據(jù)可能是與時(shí)間先后順序有關(guān),需要按照時(shí)間先后順序排序,這時(shí)候需要先把帶有時(shí)間的列轉(zhuǎn)為date_time格式,再進(jìn)行排序。
df1['time'] = pd.to_datetime(df1['time']) df1.sort_values('time', inplace=True)inplace代表是否更改數(shù)據(jù),默認(rèn)是False,要保存結(jié)果的話(huà)需要inplace=True。
其他操作
pandas操作2(增加列并賦值/兩列時(shí)間相減/按時(shí)間合并且求和)
pandas操作3(插入列insert/統(tǒng)計(jì)出現(xiàn)次數(shù)value_counts)
pandas操作4(處理缺失值,位置索引)
總結(jié)
以上是生活随笔為你收集整理的pandas操作1(读csv不要索引/写csv不要索引/删除有空值行/按时间排序)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: python数据集划分_机器学习和数据集
- 下一篇: 酒店预订小程序开发的特色优势