javascript
JavaScript进行UTF-8编码与解码
JavaScript本身可通過(guò)charCodeAt方法得到一個(gè)字符的Unicode編碼,并通過(guò)fromCharCode方法將Unicode編碼轉(zhuǎn)換成對(duì)應(yīng)字符。
但charCodeAt方法得到的應(yīng)該是一個(gè)16位的整數(shù),每個(gè)字符占用兩字節(jié)。在網(wǎng)絡(luò)上傳輸一般采用UTF-8編碼,JavaScript本身沒(méi)有提供此類(lèi)方法。不過(guò)有一個(gè)簡(jiǎn)便的辦法來(lái)實(shí)現(xiàn)UTF-8的編碼與解碼。
Web要求URL的查詢(xún)字符串采用UTF-8編碼,對(duì)于一些特殊字符或者中文等,會(huì)編碼成多個(gè)字節(jié),變成%加相應(yīng)16進(jìn)制碼的形式。比如:漢字 中 將會(huì)被編碼為%E4%B8%AD。
為此JavaScript提供了encodeURIComponent與decodeURIComponent方法組合來(lái)對(duì)查詢(xún)字符串進(jìn)行編碼與解碼。利用這一點(diǎn),我們可以將encodeURIComponent方法編碼后的字符串進(jìn)行處理,最終得到對(duì)應(yīng)的字節(jié)數(shù)組。代碼如下:
function encodeUtf8(text) {const code = encodeURIComponent(text);const bytes = [];for (var i = 0; i < code.length; i++) {const c = code.charAt(i);if (c === '%') {const hex = code.charAt(i + 1) + code.charAt(i + 2);const hexVal = parseInt(hex, 16);bytes.push(hexVal);i += 2;} else bytes.push(c.charCodeAt(0));}return bytes; }這個(gè)方法的作用是得到某一個(gè)字符串對(duì)應(yīng)UTF-8編碼的字節(jié)序列,可在服務(wù)端語(yǔ)言,如C#中通過(guò) System.Text.Encoding.UTF8.GetString(bytes) 方法將字節(jié)序列解碼為相應(yīng)的字符串。
而對(duì)應(yīng)的,將以UTF-8編碼的字節(jié)序列解碼為String的JavaScript方法為:
function decodeUtf8(bytes) {var encoded = "";for (var i = 0; i < bytes.length; i++) {encoded += '%' + bytes[i].toString(16);}return decodeURIComponent(encoded); }該方法將每一字節(jié)都轉(zhuǎn)換成%加16進(jìn)制數(shù)字的表示形式,再通過(guò)decodeURIComponent方法解碼,即可得到相應(yīng)的字符串。使用示例如下:
var array = encodeUtf8('ab熱cd!'); console.log(array); // 打印 [97, 98, 231, 131, 173, 99, 100, 33] var content = decodeUtf8(array); console.log(content); // 打印 ab熱cd!對(duì)應(yīng)的C#使用示例如下:
var bytes = System.Text.Encoding.UTF8.GetBytes("ab熱cd!"); // 以下循環(huán)將打印 97 98 231 131 173 99 100 33 foreach (var b in bytes)Console.Write(b + " "); Console.Write("\n"); var content = System.Text.Encoding.UTF8.GetString(bytes); Console.WriteLine(content); // 打印 ab熱cd!通過(guò)以上方法組合,即可通過(guò)websocket在前端與后端之間以二進(jìn)制的形式交換數(shù)據(jù),方便協(xié)議的制定。
轉(zhuǎn)載于:https://www.cnblogs.com/coloc/p/8111601.html
總結(jié)
以上是生活随笔為你收集整理的JavaScript进行UTF-8编码与解码的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。