火车头如何把标题加html标签,火车头采集中内容页及标签Xpath可视化提取功能的使用...
生活随笔
收集整理的這篇文章主要介紹了
火车头如何把标题加html标签,火车头采集中内容页及标签Xpath可视化提取功能的使用...
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
在上一篇文章《火車頭采集中列表頁及標簽Xpath可視化提取功能的使用》中,我們講解了火車頭采集器如何利用Xpath來采集列表頁。今天,我們就說說如何火車頭采集器如何利用Xpath來采集內容頁面!
新建標簽,提前數據方式選擇,“可視化提取”選項 ,如下圖:
同樣點擊“通過XPath瀏覽器獲取” 按鈕。
和上面獲取地址一樣的,輸入地址,訪問要采集的地址,如下圖:
然后點擊圖標開始選擇,我們這里用獲取標題為例說明。
淡藍色框選中標題,輕輕點擊鼠標,然后測試看下是否正確。如果正確點擊確定按鈕。這個不像采集地址的時候需要做2遍。如果測試彈出:
這個就是說明這個頁面不能使用這個方式獲取。
點擊確定后如下圖:
獲取這個標題的表達式就自動填寫在這里了。我們測試下結果:
結果是正確的。別的其他信息都可以通過這個方式獲取。
有個節點屬性如下圖:
這個是也是專業術語,大家可以查資料了解下,一般選中InnerHtml和 InnerText 就可以獲取到文字信息了,需要了解更多,自行查找資料。
選擇“Href”是獲取鏈接地址,選擇“OuterHtml”是獲取文字和包含的html代碼。大家如果不明白可以實際操作測下結果。
總結
以上是生活随笔為你收集整理的火车头如何把标题加html标签,火车头采集中内容页及标签Xpath可视化提取功能的使用...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 猪八戒网--中国威客交易平台
- 下一篇: ImageJ+OriginLab简单实现