请求数据分析 xpath语法 与lxml库
生活随笔
收集整理的這篇文章主要介紹了
请求数据分析 xpath语法 与lxml库
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
前情提要:
上節學過從網上獲取請求,獲取返回內容,帶理
獲取內容之后,第二部就是獲取請求的數據分析
一:xpath 語法
瀏覽器一般會自帶xpatn 解析
這里大概講述一下xpath 的基本操作
?
二:式例
我用的是360 瀏覽器...(..用了好多年了..習慣了..)
我們拿筆趣閣進行測試
https://www.biquge5200.cc/46_46254/
1>進入開發者模式
2>寫xpath?
>2.1?
// ? ? ? ?獲取子孫節點
??div ? ? ? ?div ?節點
// ? ? ? ? ?獲取上一層下的子孫節點
dl ? ? ? ? ?dl ?節點
// ? ? ? ? ? ?獲取上一層下的子孫節點
dd ? ? ? ? dd節點
[position()] ? ? ? ? ? ? 節點內的位置
> ? ? ? ? ? ? ? ? ? ? ? ? ? ?比較運算符
9 ? ? ? ? ? ? ? ? ? ? ? ? ? ? 第九個節點
三: lxml 解析器
?
# 本地使用 # from lxml import etree # htmlElent =etree.HTML(text) # print(type(htmlElent)) #html對象 # print(etree.tostring(htmlElent,encoding='utf-8').decode('utf-8'))# etree.tostring 規范化并補全#讀取文件中的html # from lxml import etree # parser =etree.HTMLParser(encodeing=('utf-8')) #定義解析器 # #解析器作用 補全html 和規范html # htmlElent =etree.parse("lagou.html",parser=parser) # # 讀取本地html 文件. 傳入解析器 # print(etree.tostring(htmlElent,encoding='utf-8').decode('utf-8'))
?
轉載于:https://www.cnblogs.com/baili-luoyun/p/10426842.html
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
以上是生活随笔為你收集整理的请求数据分析 xpath语法 与lxml库的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: iScroll 5 API 中文版
- 下一篇: -bash: 未预期的符号 `(' 附近