python url加密解密_小叮当Python进阶(二):爬虫与加密算法Part2之URL与Base64
想一次給大家詳盡介紹完Python中常見的加密算法,無奈篇幅有限,只能分篇為大家分享。
URL編碼
正常的URL中是只能包含ASCII字符的,也就是字符、數字和一些符號。
URL編碼簡單來說,就是一種瀏覽器用來避免解析URL時出現特殊字符(非ASCII字符,例如漢字等)的編碼方式。
可以說URL編碼的實質就是將超出ASCII范圍的字符轉換成帶%的十六進制格式。
在Python中利用binascii模塊,我們可以將十六進制形式的有含義的字節轉換成我們在加解密中更常用的方式,例如ASCII碼的形式。
其中binascii.b2a_hex()表示將二進制(binary)轉化成ascii碼,b2a即是“binary to ascii”的簡寫。
下面我們用Python來實現URL編碼。
Base64編碼
Base64是一種用64個字符來表示任意二進制數據的加密方法。64個字符指:“A~Z a~z 0~9 + / =”
某種意義上來講,Base64編碼是密碼學的基石。因為我們可以將任意的二進制數據進行Base64編碼。并且可以生成只用64個字符就能表示其含義的文本文件。
值得注意的是:Base64編碼后的數據約等于編碼前數據的4/3。相比較于編碼前的數據,編碼后的數據大小增加了1/3左右。
1.Base64編碼步驟
Step1.將所有字符轉化為ASCII碼。Step2.將ASCII碼轉化為8位二進制 。
Step3.將二進制3個歸成一組(不足3個在后邊補0)共24位,再拆分成4組,每組6位。
Step4.統一在6位二進制前補兩個0湊足8位。Step5.將補0后的二進制轉為十進制。
Step6.從Base64編碼表獲取十進制對應的Base64編碼。
2.Base64編碼轉換規則:
①轉換的時候,將三個byte的數據,先后放入一個24bit的緩沖區中,先來的byte占高位。
②數據不足3byte的話,于緩沖區中剩下的bit用0補足。然后,每次取出6個bit,按照其值選擇查表選擇對應的字符作為編碼后的輸出。
③如此不斷地進行,直到全部輸入數據轉換完成。
④如果最后剩下兩個輸入數據,在編碼結果后加1個“=”。
⑤如果最后剩下一個輸入數據,編碼結果后加2個“=”。
⑥如果沒有剩下任何數據,就什么都不要加,以此來保證資料還原的正確性。
3.Python實現Base64
幸運的是,Python內置的base64模塊可以直接進行base64的編解碼。我們不必再依據算法編寫。
小貼士:用于base64編碼的,要么是ASCII包含的字符,要么是二進制數據。
由于篇幅有限,其它常見的加密算法例如MD5、DES等將在之后的篇幅中繼續為大家分享。
總結
以上是生活随笔為你收集整理的python url加密解密_小叮当Python进阶(二):爬虫与加密算法Part2之URL与Base64的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ogre绘制3d图形_R语言统计与绘图:
- 下一篇: php foreach 循环 判断ind