文本编码解释
一張圖解釋字符集
舉例說明什么是編碼:
UTF-8編碼
等長編碼對于英文來說浪費(fèi)空間,所以出現(xiàn)了變長編碼UTF系列,如UTF8,UTF16,UTF32。
UTF8的編碼對象是整個(gè)Unicode字符集,所以可以表示所有國家的語言而不會亂碼,所以叫“萬國碼”。所以網(wǎng)絡(luò)傳輸文本一般使用UTF-8編碼,如網(wǎng)頁,這樣可以在不同的電腦上看到相同的文本而不亂碼。
GB2312編碼
但是UTF8還是對于英文來說,還是單個(gè)字節(jié),但是對于其他語言編碼還是多個(gè)字節(jié),占用空間仍然較大。
如果只針對中文進(jìn)行編碼,被編碼文字只有幾萬字,那么會節(jié)省很多空間。常用的簡體中文編碼有GBK/GB2312,GB表示國家標(biāo)準(zhǔn)。雖然節(jié)省的存儲空間,但是前提是需要知道文本的語言是什么。所以只在中文環(huán)境下使用。
- 完
總結(jié)
- 上一篇: 对分查找的最多次数_「剑指offer题解
- 下一篇: 浦发腾讯动漫联名信用卡申请进度查询