HTTP协议中的chunked编码解析
“?HTTP協議中的chunked傳輸編碼全接觸。”
在HTTP協議中,服務器發往客戶端的數據中,通常都包括HTTP頭和HTTP體,當存在HTTP體的時候,HTTP體的長度通常是由HTTP頭內的“Content-Length”字段確定。
就像下圖:
不過,“Content-Length”字段并非總是存在,這就涉及到今天要講的chunked編碼,它在HTTP協議標準的早期并不存在,而是在HTTP 1.1 才開始被引入到協議中。
chunked編碼允許服務器發出的數據被分成多個部分,這樣,服務器就可以在發送數據前無需知道待發送內容的總大小。因為它不需要填充“Content-Length”字段。
當HTTP使用chunked編碼進行傳輸的時候,在HTTP頭部會出現字段“Transfer-Encoding: chunked”。同時,“Content-Length”字段相應地就不會出現了。
如圖:
當HTTP頭部標示了HTTP體的數據為chunked編碼時,整個HTTP體將是chunked編碼。
chunked編碼的一般格式如下:
len1\r\ndata1\r\nlen2\r\ndata2\r\n........0\r\n\r\n
即數據采用分塊的模式進行傳輸,編碼后的每塊數據包含一個長度值和對應長度的傳輸內容,長度值為16進制數據的字符串形式,如上圖的b50表示該塊數據的傳輸內容長度為0xb50字節。長度值之后為固定值"\r\n",傳輸內容之后也是固定值"\r\n"。chunked編碼的最后一塊為“0\r\n\r\n”,即數據塊的長度為0。
在解析chunked編碼時,按每塊的長度將傳輸的內容進行拼接,直至塊長為0的塊即完成一個chunked編碼的解析。如上圖的圖片,就僅一個0x158字節的數據塊,它的第二塊chunked就已經是“0\r\n\r\n”了。
chunked編碼很簡單,是不是?
不過,在協議還原的實現過程中,如何高效高性能地對chunked進行解碼,是一件值得挑戰的事哦。畢竟,HTTP的流量占比不小的。
長按進行關注。
總結
以上是生活随笔為你收集整理的HTTP协议中的chunked编码解析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: QP编码详解
- 下一篇: gzip格式分析与识别