编码表【理解】
-
什么是字符集
是一個(gè)系統(tǒng)支持的所有字符的集合,包括各國(guó)家文字、標(biāo)點(diǎn)符號(hào)、圖形符號(hào)、數(shù)字等
l計(jì)算機(jī)要準(zhǔn)確的存儲(chǔ)和識(shí)別各種字符集符號(hào),就需要進(jìn)行字符編碼,一套字符集必然至少有一套字符編碼。常見字符集有ASCII字符集、GBXXX字符集、Unicode字符集等
-
常見的字符集
-
ASCII字符集:
lASCII:是基于拉丁字母的一套電腦編碼系統(tǒng),用于顯示現(xiàn)代英語,主要包括控制字符(回車鍵、退格、換行鍵等)和可顯示字符(英文大小寫字符、阿拉伯?dāng)?shù)字和西文符號(hào))
基本的ASCII字符集,使用7位表示一個(gè)字符,共128字符。ASCII的擴(kuò)展字符集使用8位表示一個(gè)字符,共256字符,方便支持歐洲常用字符。是一個(gè)系統(tǒng)支持的所有字符的集合,包括各國(guó)家文字、標(biāo)點(diǎn)符號(hào)、圖形符號(hào)、數(shù)字等
-
GBXXX字符集:
GBK:最常用的中文碼表。是在GB2312標(biāo)準(zhǔn)基礎(chǔ)上的擴(kuò)展規(guī)范,使用了雙字節(jié)編碼方案,共收錄了21003個(gè)漢字,完全兼容GB2312標(biāo)準(zhǔn),同時(shí)支持繁體漢字以及日韓漢字等
-
Unicode字符集:
UTF-8編碼:可以用來表示Unicode標(biāo)準(zhǔn)中任意字符,它是電子郵件、網(wǎng)頁及其他存儲(chǔ)或傳送文字的應(yīng)用 中,優(yōu)先采用的編碼。互聯(lián)網(wǎng)工程工作小組(IETF)要求所有互聯(lián)網(wǎng)協(xié)議都必須支持UTF-8編碼。它使用一至四個(gè)字節(jié)為每個(gè)字符編碼
編碼規(guī)則:
128個(gè)US-ASCII字符,只需一個(gè)字節(jié)編碼
拉丁文等字符,需要二個(gè)字節(jié)編碼
大部分常用字(含中文),使用三個(gè)字節(jié)編碼
其他極少使用的Unicode輔助字符,使用四字節(jié)編碼
-
總結(jié)
- 上一篇: 为什么会出现字符流
- 下一篇: 字符串中的编码解码问题