pandas读取大文件csv容易出现的错误
生活随笔
收集整理的這篇文章主要介紹了
pandas读取大文件csv容易出现的错误
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
文章目錄
- 1. 不是utf-8格式,先讀取一遍為utf-8,忽略掉錯誤:
- 2. 出現null bytes錯誤,使用engine='c':
- 3. 讀取成功之后,保存為utf-8格式:
1. 不是utf-8格式,先讀取一遍為utf-8,忽略掉錯誤:
filename = open('E://source_data/insured_utf-8.csv', encoding='utf-8',errors='ignore') df_chunk = pd.read_csv('E://source_data/insured_utf-8.csv', chunksize=1000000, parse_dates=True, encoding = "utf-8", dtype='object',error_bad_lines= False,engine='c')2. 出現null bytes錯誤,使用engine=‘c’:
df_chunk = pd.read_csv('E://source_data/insured_utf-8.csv', chunksize=1000000, parse_dates=True, encoding = "utf-8", dtype='object',error_bad_lines= False,engine='c')3. 讀取成功之后,保存為utf-8格式:
df_concat.to_csv('E://source_data/insured_utf-8.csv',header=True,index=False,encoding = "utf-8")總結
以上是生活随笔為你收集整理的pandas读取大文件csv容易出现的错误的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 50-100G大文件的处理办法
- 下一篇: 从GB到GBDT到XGBoost