pythonpyquery去掉br_如何在将pyquery对象转换为字符串时取消特殊字符的转义
我試圖用python請求模塊獲取一個遠程頁面,重建一個DOM樹,做一些處理并將結果保存到文件中。當我獲取一個頁面,然后將其寫入文件時,一切都正常(我可以稍后在瀏覽器中打開一個html文件,它會正確呈現)。在
但是,如果我創建了一個pyquery對象并進行了一些處理,然后使用str轉換來保存它,則會失敗。特別是,在保存的源代碼的腳本標記中修改了諸如&;等特殊字符(這是由應用pyquery引起的),它會阻止頁面正確呈現。在
這是我的代碼:import requests
from lxml import etree
from pyquery import PyQuery as pq
user_agent = {'User-agent': 'Mozilla/5.0'}
r = requests.get('http://www.google.com',headers=user_agent, timeout=4)
DOM = pq(r.text)
#some optional processing
fTest = open("fTest.html","wb")
fTest.write(str(DOM))
fTest.close()
所以,問題是:如何確保特殊字符在應用pyquery之后不會被轉義?我想它可能與lxml(pyquery的父庫)有關,但是經過冗長的在線搜索和對不同對象序列化方法的實驗,我還是沒有成功。也許這也和unicode處理有關?!在
先謝謝你!在
總結
以上是生活随笔為你收集整理的pythonpyquery去掉br_如何在将pyquery对象转换为字符串时取消特殊字符的转义的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ios 构建版本一直在处理中_iOS构建
- 下一篇: python期中考试知识点_大学期末考试