當前位置：首頁 > 编程语言 > python >内容正文

python

[python3 - TroubleShooting] requests爬取中文网站后直接print，以及保存csv乱码

發布時間：2024/9/5 python 39 豆豆

生活随笔收集整理的這篇文章主要介紹了 [python3 - TroubleShooting] requests爬取中文网站后直接print，以及保存csv乱码小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

問題：

背景：

嘗試：

直接print page; 寫入csv文件的時候, 不指定編碼

writerow()報錯 -?UnicodeEncodeError: 'gbk' codec can't encode character '\xe6' in position 0: illegal multibyte sequence

直接print page; 寫入csv文件的時候，encoding='gbk'

直接print page; 寫入csv文件時，encoding='utf-8'

page.encode('utf-8').decode('gbk') - 對page進行utf-8編碼后用gbk解碼

page.encode('gbk','ignore').decode('gbk')；寫入csv時，encoding='gbk' - 對page進行gbk編碼后用gbk解碼

page.encode('gbk','ignore').decode('gbk')；寫入csv時，encoding='utf-8' - 對page進行gbk編碼后用gbk解碼

page.encode(resquests.get().encoding).decode('gbk'); 寫入csv時，encoding='utf-8'

page.encode(resquests.get().encoding).decode('gbk'); 寫入csv時，encoding='gbk'

page.encode(resquests.get().encoding).decode('gbk'); 寫入csv時，不指定編碼

結論：

轉載于:https://www.cnblogs.com/break-dawnn/p/9044075.html

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。