python中decode函数在哪个库_python encode和decode函数说明
字符串編碼常用類型:utf-8,gb2312,cp936,gbk等。
Python中,我們使用decode()和encode()來進(jìn)行解碼和編碼
在python中,使用unicode類型作為編碼的基礎(chǔ)類型。即
decode????????????? encode
str ---------> unicode --------->str
u = u'中文' #顯示指定unicode類型對象u
str = u.encode('gb2312') #以gb2312編碼對unicode對像進(jìn)行編碼
str1 = u.encode('gbk') #以gbk編碼對unicode對像進(jìn)行編碼
str2 = u.encode('utf-8') #以utf-8編碼對unicode對像進(jìn)行編碼
u1 = str.decode('gb2312')#以gb2312編碼對字符串str進(jìn)行解碼,以獲取unicode
u2 = str.decode('utf-8')#如果以utf-8的編碼對str進(jìn)行解碼得到的結(jié)果,將無法還原原來的unicode類型
如上面代碼,str\str1\str2均為字符串類型(str),給字符串操作帶來較大的復(fù)雜性。
好消息來了,對,那就是python3,在新版本的python3中,取消了unicode類型,代替它的是使用unicode字符的字符串類型(str),字符串類型(str)成為基礎(chǔ)類型如下所示,而編碼后的變?yōu)榱俗止?jié)類型(bytes)但是兩個函數(shù)的使用方法不變:
decode????????????? encode
bytes ------> str(unicode)------>bytes
u = '中文' #指定字符串類型對象u
str = u.encode('gb2312') #以gb2312編碼對u進(jìn)行編碼,獲得bytes類型對象str
u1 = str.decode('gb2312')#以gb2312編碼對字符串str進(jìn)行解碼,獲得字符串類型對象u1
u2 = str.decode('utf-8')#如果以utf-8的編碼對str進(jìn)行解碼得到的結(jié)果,將無法還原原來的字符串內(nèi)容
避免不了的是,文件讀取問題:
假如我們讀取一個文件,文件保存時,使用的編碼格式,決定了我們從文件讀取的內(nèi)容的編碼格式,例如,我們從記事本新建一個文本文件test.txt, 編輯內(nèi)容,保存的時候注意,編碼格式是可以選擇的,例如我們可以選擇gb2312,那么使用python讀取文件內(nèi)容,方式如下:
f = open('test.txt','r')
s = f.read() #讀取文件內(nèi)容,如果是不識別的encoding格式(識別的encoding類型跟使用的系統(tǒng)有關(guān)),這里將讀取失敗
'''假設(shè)文件保存時以gb2312編碼保存'''
u = s.decode('gb2312') #以文件保存格式對內(nèi)容進(jìn)行解碼,獲得unicode字符串
'''下面我們就可以對內(nèi)容進(jìn)行各種編碼的轉(zhuǎn)換了'''
str = u.encode('utf-8')#轉(zhuǎn)換為utf-8編碼的字符串str
str1 = u.encode('gbk')#轉(zhuǎn)換為gbk編碼的字符串str1
str1 = u.encode('utf-16')#轉(zhuǎn)換為utf-16編碼的字符串str1
python給我們提供了一個包codecs進(jìn)行文件的讀取,這個包中的open()函數(shù)可以指定編碼的類型:
import codecs
f = codecs.open('text.text','r+',encoding='utf-8')#必須事先知道文件的編碼格式,這里文件編碼是使用的utf-8
content = f.read()#如果open時使用的encoding和文件本身的encoding不一致的話,那么這里將將會產(chǎn)生錯誤
f.write('你想要寫入的信息')
f.close()
知識點
總結(jié)
以上是生活随笔為你收集整理的python中decode函数在哪个库_python encode和decode函数说明的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 还不起债了?美国决定增加长期债务发行以拖
- 下一篇: 一个完整的期货交易流程包括哪些?这五个环