ue字符编码_用ultraedit实现编码转换
BOM
這里涉及到一個BOM(Byte Order Mark)
的概念.簡單的講,在Unicode標準中,為了標示文本文件的編碼類型,可以在文本文件的開始插入幾個特殊的byte,通過這幾個特殊的byte,應用
程序就可以鑒別文本文件使用的是那種編碼了.那幾個特殊的byte也被稱之為BOM(參考:http://unicode.org/faq/utf_bom.html ).
對于Unicode,幾種編碼的BOM如下:
UTF-32, big-endian 文件的前4個byte是:00 00 FE FF
UTF-32, little-endian文件的前4個byte是:FF FE 00 00
UTF-16, big-endian文件的前2個byte是:FE FF
UTF-16, little-endian文件的前2個byte是:FF FE
UTF-8文件的前3個byte是:EF BB BF
UTF-7的規律特殊一點,不是前幾個byte,而是所有的byte轉換為十進制都小于127.
使用UltraEdit打開一個文本文件,可以不用關心其編碼.(Notepad創建的文件的默認編碼還是當前code page設定的編碼,在簡體中文環境下是 CP936, 即GBK)
設定UltraEdit當前的code page: 選擇 "View -> Set Code Page", 然后選擇你需要的code page. 這樣后面執行的編碼轉換操作都是根據這里設定的code page進行的.
選擇 "Edit -> Hex Function -> Hex Edit" 進入Hex編輯模式,這樣你可以輸入任意你需要的16進制數字,例如 4E02(Unicode) 或者 8140(GBK) ( "丂" )
轉換: 根據你當前的文件的編碼,選擇 "File -> Conversions -> Unicode to
A
總結
以上是生活随笔為你收集整理的ue字符编码_用ultraedit实现编码转换的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: S-LIME阅读笔记(有实验代码)
- 下一篇: Katana中设置全局变量