盘点CSV文件在Excel中打开后乱码问题的两种处理方法
點擊上方“Python爬蟲與數(shù)據(jù)挖掘”,進行關(guān)注
回復(fù)“書籍”即可獲贈Python從入門到進階共10本電子書
今
日
雞
湯
千載琵琶作胡語,分明怨恨曲中論。
????大家好,我是Python進階者。前幾天給大家分享了一些亂碼問題的文章,閱讀量還不錯,感興趣的小伙伴可以前往:盤點3種Python網(wǎng)絡(luò)爬蟲過程中的中文亂碼的處理方法,UnicodeEncodeError: 'gbk' codec can't encode character解決方法
前言
????前幾天有個叫【RSL】的粉絲在Python交流群里問了一道關(guān)于CSV文件在Excel中打開后亂碼的問題,如下圖所示。
????在Excel中直接打開csv文件,如下圖所示:
????群中提問:
????看上去確實頭大,對于爬蟲初學(xué)者來說,這個亂碼擺在自己面前,猶如攔路虎一般難頂。不過別慌,小編在這里給大家整理了兩種方法,專門用于針對CSV文件亂碼的,希望大家在后面再次遇到這樣亂碼的問題,在此處可以得到靈感!
一、思路
????其實解決問題的關(guān)鍵點就是在于一點,就是編碼的轉(zhuǎn)換。這里例舉兩種方法,肯定還有其他的方法的,也歡迎大家在評論區(qū)諫言。
二、解決方案
方法一:notepad++打開
? ? 因為csv文件本質(zhì)上也是文本文件,本身用notepad++打開csv文件是可以直接打開,不會亂碼的。如果在網(wǎng)絡(luò)爬蟲的時候,指定了存儲格式為utf-8編碼,那么該csv文件用notepad++打開是沒啥問題的。
f?=?open('filename.csv',?mode='a',?encoding="utf-8") csvwriter = csv.writer(f)????如下圖所示:
????因為我源文件本身就是韓語和日本語,所以看到的就是這個了,上圖絕不是亂碼哈,別誤導(dǎo)了大家,嘻嘻!
方法二:Excel轉(zhuǎn)換
?????這個方法稍微復(fù)雜一些,但是比較好理解,對于初學(xué)者來說,還是比較好接受的,直接在Excel中進行操作,步驟如下。
1)打開一個Excel文件,之后依次點擊“數(shù)據(jù)”-->“從文本/CSV”,如下圖所示。
2)之后選擇需要加載的CSV文件,然后會自動彈出下圖
????從這里看的是原始文件,確實是亂碼的存在,接下來需要稍微設(shè)置下就可以了。
3)文件原始格式設(shè)置為“無”或者你的原始編碼“UTF-8”;分隔符默認是逗號;數(shù)據(jù)類型檢測選擇基于整個數(shù)據(jù)集,最后選擇右下方的加載,如下圖所示。
4)之后稍等片刻,CSV文件就會自動加載到Excel,如下圖所示。
???因為我源文件本身就是韓語和日本語,所以看到的就是這個了。
5)在Excel中的顯示,如下圖所示:
????看上去還是比較清爽的,如此一來,中文亂碼的問題就迎刃而解了。之后你就可以進行進一步的轉(zhuǎn)存為標(biāo)準(zhǔn)的Excel文件或者進行數(shù)據(jù)處理都可以。
三、總結(jié)
??? 我是Python進階者。本文基于粉絲提問,針對CSV文件在Excel中打開后亂碼問題,給出了兩種亂碼解決方法,順利幫助粉絲解決了問題。雖然文中例舉了兩種方法,但是小編相信肯定還有其他的方法的,也歡迎大家在評論區(qū)諫言。
????小伙伴們,快快用實踐一下吧!如果在學(xué)習(xí)過程中,有遇到任何問題,歡迎加我好友,我拉你進Python學(xué)習(xí)交流群共同探討學(xué)習(xí)。
-------------------?End?-------------------
往期精彩文章推薦:
手把手教你采集京東銷售數(shù)據(jù)并做簡單的數(shù)據(jù)分析和可視化
手把手教你用Pyecharts庫對淘寶數(shù)據(jù)進行可視化展示
手把手教你用Pandas庫對淘寶原始數(shù)據(jù)進行數(shù)據(jù)處理和分詞處理
Python項目實戰(zhàn)篇——常用驗證碼標(biāo)注&識別(前端+后端實現(xiàn)高效率數(shù)據(jù)標(biāo)注)
歡迎大家點贊,留言,轉(zhuǎn)發(fā),轉(zhuǎn)載,感謝大家的相伴與支持
想加入Python學(xué)習(xí)群請在后臺回復(fù)【入群】
萬水千山總是情,點個【在看】行不行
/今日留言主題/
隨便說一兩句吧~~
總結(jié)
以上是生活随笔為你收集整理的盘点CSV文件在Excel中打开后乱码问题的两种处理方法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C语言十进制转八进制
- 下一篇: Vs2008调试慢的问题