python字符集_Python任意字符集转换
在python處理文本的過程中,經(jīng)常會有文本字符集轉(zhuǎn)換的情況,
而我們希望用一個方法,不用關(guān)心文本原本的字符集是什么樣的,直接轉(zhuǎn)換成想要的任何字符集就可以了。
方法一:
import chardet
def convert_encoding(data,new_coding='UTF-8'):
# 任意字符集轉(zhuǎn)換
encoding = chardet.detect(data)['encoding']
if new_coding.upper() != encoding.upper():
data = data.decode(encoding,data).encode(new_coding)
return data
方法二:
import icu
def convert_encoding2(data,new_coding='UTF-8'):
encoding = icu.CharsetDetector(data).detect().getName()
# encoding = chardet.detect(content)['encoding']
if new_coding.upper() != encoding.upper():
# data = data.decode(encoding,data).encode(new_coding)
data = unicode(data,coding).encode(new_coding)
return data
方法三:
import cchardet
def convert_encoding3(data,new_coding='UTF-8'):
encoding = cchardet.detect(data)['encoding']
if new_coding.upper() != encoding.upper():
data = data.decode(encoding,data).encode(new_coding)
return data
使用方法:
此處使用方法一
#轉(zhuǎn)換成utf-8
convert_encoding(data,'utf-8')
#轉(zhuǎn)抱成GBK
convert_encoding(data,'gbk')
#轉(zhuǎn)抱成GB2312
convert_encoding(data,'gbk')
總結(jié)
以上是生活随笔為你收集整理的python字符集_Python任意字符集转换的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ios 点击出现另外一套tabbar_i
- 下一篇: qt 背景和控件布局_Qt控件背景图片设