python第二十八课——编码小常识
生活随笔
收集整理的這篇文章主要介紹了
python第二十八课——编码小常识
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
2.內存和硬盤:
內存:計算機硬件組成部分之一,它是一個容器,用來存儲數據;處理數據速度快,
存儲數據量小;斷電死機數據會丟失,短暫性存儲數據
硬盤:計算機硬件組成部分之一,它是一個容器,用來存儲數據;處理數據速度慢,
存儲數據量大,斷電死機數據不會丟失,數據的持久存儲
3.字節和字符
字節:計算機的存儲數據的單位,底層唯一能夠識別并且運算的數據
字符:人類將字節封裝為另一種能直接識別的數據單位,底層還是字節
4.如何區分字節文件和字符文件
如果使用文本編輯器打開能看得懂(不會亂碼)那它就是一個字符文件,
反之,它是一個字節文件
提問:常見的字節文件和字符文件有哪些?(枚舉出一些)
字節文件:圖片文件(.jpg、.png...)、視頻文件(.avi、.mp4、.rmb...)、音頻文件(.mp3...)
字符文件:.txt、.py、.java、.js、.html、.css、.php...
思考:.doc結尾的文件是字節還是字符文件?
是字節文件,因為.doc結尾的文件中既可以包含字符內容,也可以包含圖片、顏色設置...操作
思考:計算機數據層面,一切皆字節,對不對?
對的;因為計算機底層唯一能夠識別和運算的都是字節數據...
5.字符編碼(字符集)
ascii碼表:U.S.A設計出來的,范圍非常小;不包含很多國家的文字,英文字符占用內存1個字節
utf-8碼表:現今比較通用的一張編碼表,包含了世界上所有的文字內容,范圍:0~65535之間,
1個漢字占用內存3個字節,1個英文字符占用內存1個字節
gbk碼表:gbk屬于gb2312的擴充版,兼容了gb2312中的所有字符,加入更多的一些漢字內容,
1個漢字占用內存2個字節,1個英文字符占用內存1個字節,
在我們中國環境下,大多數情況默認的都是gbk作為編碼
6.編碼和解碼:
編碼:讓數據從看的懂到看不懂,就是編碼
解碼:讓數據從看不懂到看得懂,就是解碼
【注意】
編碼和解碼如果不一致會怎么樣?
1).會出現亂碼現象
2).會報錯
不管是上述的1還是2都是不理想的結果,我們都需要避免
字符串的兩個函數引入:
encode(encoding,errors):對字符串數據進行編碼操作,得到一個bytes類型的數據
decode(encoding,errors):對字符串數據進行解碼操作,得到一個str類型的數據
演示eccode()和decode()函數的使用: str1='哈哈呵呵'#編碼:encode() b=str1.encode(encoding='utf-8') print(b,type(b))#解碼:decode() str2=b.decode('utf-8','ignore') print(str2,type(str2))
轉載于:https://www.cnblogs.com/hankleo/p/10440171.html
總結
以上是生活随笔為你收集整理的python第二十八课——编码小常识的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 京东白条怎么学生认证?认证步骤详解
- 下一篇: 农行ETC信用卡有年费吗?农行ETC信用