PDF结构分析
一、 簡單了解PDF
1 PDF格式
一個PDF文檔從根本上來說是一個8字節(jié)序列。 其實(shí)PDF格式和我們已經(jīng)熟知的HTML,XML等結(jié)構(gòu)化的文件格式一樣,包含有關(guān)鍵字,分隔符,數(shù)據(jù)等等。不同的是PDF文件是按照二進(jìn)制流的方式保存的,而html文件則是可讀的文本方式保存的。
2 PDF規(guī)范的發(fā)展
PDF規(guī)范的6次升級:
1.11995 加入了文檔加密(40字節(jié)),線索樹,名字樹,鏈接,設(shè)備獨(dú)立色彩資源。
1.21996 表單, 半色調(diào)屏幕,和其他的一些高級色彩特性, 對中文,日文和韓文的支持
1.32000 數(shù)字簽名, 邏輯結(jié)構(gòu), JavaScript, 嵌入式文件,Masked Images, 平滑陰影, 支持 CID字體的附加色彩。
1.42001 文件加密 (128 字節(jié)), 標(biāo)簽式 PDF, 訪問控制,透明,元數(shù)據(jù)流
1.52003 文檔加密 (公鑰), JPEG 2000 壓縮,可選的內(nèi)容組,附加的注解類型
1.62005 文檔加密 (AES),增加最大文件支持,加入3D支持,額外的注解類型
3 PDF文件的基本組成
這四部分分別為:
l 文件頭,指明了該文件所遵從的PDF規(guī)范的版本號,它出現(xiàn)在PDF<
總結(jié)
- 上一篇: 90后中国程序员“黑吃黑”博彩网站,半年
- 下一篇: 嵌入生活的嵌入式,超市里的电子价签