linux环境生成pdf字体问题,字体概述与Linux字体常见问题的解决.pdf
字體概述及Linux字體常見問題的解決
作者:penggb@
March 1, 2010
Linux的字體 問題是 Linux 初學者經常碰到 的問題之一 ,也是 Linux 飽受
非議的問題之一 。很多初學者就是因為 Linux 下糟糕的字體 ,而 回到 windows
的懷抱 的。不得不承認,微軟在計算機字體方面作 出了巨大 的貢獻,并成功 的
應用在windows 操作系統中,使廣大的windows 用戶在根本不了解計算機字體
的情況下,就可 以使用微軟為他們提供 的優美 的計算機字體 ,并很少 出現亂碼
等 問題。實際上 ,在Linux 下,你也可 以很輕易地得到絲毫不遜與 windows 下
的優美 的計算機字體 。看 了下面 的介紹,你就可 以對計算機字體有個初步的認
識,而且也可 以根據本文提到 的一些方法來解決你在linux 下碰到 的大部分 的
字體 問題。
1 漢字字符的編碼方式1
為什么要討論這個 問題呢?因為這是計算機識別并顯示漢字的基礎 ,也是
導致系統出現亂碼 的罪魁禍首之一 ,所 以我們不得不去認識它。眾所周知 ,我
們常用 的計算機鍵盤不過幾十個按鍵 (這里主要指主鍵盤區,功能鍵除外 ),
這對拉丁語系的已經足夠 了,因為它們大部分是 由20-30幾個字母組成的,加上
常用 的符號,也就不過上百種字符 。如果全世界的語言都是這樣 ,那么字符 的
編碼方式就很簡單 了,也用不著過多的討論。事實上 ,很多亞洲語系的文字是
不能通過這些簡單 的編碼方式表示出來 的,拿我們最熟悉的漢字來說吧,現在
漢字的總數已經超過了6萬個,常用的漢字也有兩三千個,而且這個數量還在不
斷的增加 ,使用這樣簡單 的編碼方式,顯然表示不了這么大量的字符 。所 以就
要求采用新的編碼方式 。
1.1 GB2312-80編碼
GB2312碼是中華人 民共和 國國家漢字信息交換用編碼 ,全稱 《信息交換用
漢字編碼字符集–基本集 》,由國家標準總局發布 ,1981年5月1日實施,通行
于大陸。新加坡等地也使用此編碼 。
GB2312收錄簡化漢字及符號 、字母、日文假名等共 7445 個 圖形字符 ,
其中漢字占 6763 個 。GB2312規定 “對任意一個 圖形字符都采用兩個字節表
示,每個字節均采用七位編碼表示”,習慣上稱第一個字節為 “高字節”,
第二個字節為 “低字節”。GB2312-80包含 了大部分常用 的一 、二級漢字,和
9 區的符號 。該字符集是幾乎所有 的中文系統和 國際化 的軟件都支持 的中文
字符集 ,這也是最基本 的中文字符集 。其編碼范 圍是高位 0xa1-0xfe ,低位也
是 0xa1-0xfe;漢字從 0xb0a1 開始 ,結束于 0xf7fe 。GB2312將代碼表分為 94 個
區,對應第一字節 (0xa1-0xfe) ;每個 區 94 個位 (0xa1-0xfe) ,對應第二字節,
1關于本節的內容完全引 自/index.php?title=%E6%B1%89%E5%-
AD%97%E7%BC%96%E7%A0%81%E6%A6%82%E8%BF%B0&variant=zh-cn
1
兩個字節的值分別為區號值和位號值加 32(20H) ,因此也稱為區位碼 。01-09區
為符號、數字區,16-87 區為漢字區 (0xb0-0xf7),10-15 區、88-94 區是有待進
一步標準化 的空 白區。GB2312將收錄 的漢字分成兩級;第一級是常用漢字計
3755 個,置于 16-55 區,按漢語拼音字母/筆形順序排列;第二級漢字是次常用
漢字計3008 個 ,置于 56-87 區,按部首/筆畫順序排列 。故而 GB2312 最多能
表示6763 個漢字。
GB2312的編碼范 圍為 2121H-777EH ,與 ASCII 有重疊 ,通行方法是將
GB 碼兩個字節的最高位置 1 以示區別 。
1.2 GBK和 GB18030 編碼
由于 GB2312 表示的漢字比較有 限,因此一些偏僻漢字在GB2312 中無法
表示。隨著計算機應用 的普及 ,這個 問題日益突 出,我 國的信 息標準化委 員
會就對標準進行了擴充,得到了擴充后 的漢字編碼方案 GBK 。它一方面 向上
總結
以上是生活随笔為你收集整理的linux环境生成pdf字体问题,字体概述与Linux字体常见问题的解决.pdf的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Silverlight 里如何实现隐式样
- 下一篇: 小鱼的数字游戏