pandas read_csv 出现中文乱码
生活随笔
收集整理的這篇文章主要介紹了
pandas read_csv 出现中文乱码
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
數據文件如下:
?
代碼及錯誤:
解決過程:
猜測read_csv()不能讀取xlsx文件,于是把xlsx文件另存為csv格式,然而依然亂碼,不過數據行數是對的。
嘗試一(可行):
調用read_csv()時,指定編碼格式
文件編碼格式是GB2312
嘗試二(有問題):
把文件類型修改為utf-8后,使用pd.read_csv('./table4-3.csv') ,仍然亂碼;指定編碼utf-8調用read_csv則報錯;指定編碼gb2312不報錯,且無亂碼。好奇中?
?
?
?嘗試三(可行):
將文件另存為txt, 再使用Sublime text打開新保存的文件,按照utf-8 with dom編碼格式再保存一次,最后調用read_table()讀文件。
?總結:
1. txt文件使用read_table()
2.csv文件使用read_csv()
3.csv文件的編碼為gb2312或utf-8時,指定編碼格式pd.read_csv(name, encoding='gb2312')可解決亂碼問題。
4.如果編碼格式為utf-8,則另存為txt文件,pd.read_table(name) 不用指定編碼格式,也可以解決亂碼問題。
轉載于:https://www.cnblogs.com/zhengyyao/p/7481322.html
總結
以上是生活随笔為你收集整理的pandas read_csv 出现中文乱码的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: [js高手之路]从零开始打造一个java
- 下一篇: Map实现java缓存机制的简单实例