Python3 爬虫学习笔记 C05 【Selenium + 无界面浏览器】
Python3 爬蟲學習筆記第五章 —— 【Selenium + 無界面瀏覽器】
文章目錄
- 【5.1】關于無界面瀏覽器
- 【5.2】PhantomJS
- 【5.3】Headless Chrome
- 【5.4】Headless Firefox
【5.1】關于無界面瀏覽器
無界面(headless)瀏覽器,會把網站加載到內存并執行頁面上的 JavaScript,因為不會展示圖形界面,所以運行起來比完整的瀏覽器更高效。Selenium 搭配無界面瀏覽器使用,被稱為爬蟲利器,常用的無界面瀏覽器有:PhantomJS、Headless Chrome、Headless Firefox,其中,18年3月,PhantomJS 的作者在 GitHub 上宣布暫停開發 PhantomJS,現在使用 PhantomJS 會出現警告:UserWarning: Selenium support for PhantomJS has been deprecated, please use headless versions of Chrome or Firefox instead,所以推薦使用谷歌或者火狐的無界面瀏覽器
【5.2】PhantomJS
下載 PhantomJS:https://phantomjs.org/download.html
path 為 PhantomJS 路徑,如果系統配置了環境變量,就不用手動指定 executable_path 參數
【5.3】Headless Chrome
下載 Chromedriver:http://chromedriver.storage.googleapis.com/index.html
需要本地有 Chrome 瀏覽器,path 為 Headless Chrome 路徑,如果系統配置了環境變量,就不用手動指定 executable_path 參數
【5.4】Headless Firefox
下載 geckodriver:https://github.com/mozilla/geckodriver/releases/
需要本地有 Firefox 瀏覽器,path 為 Headless Firefox 路徑,如果系統配置了環境變量,就不用手動指定 executable_path 參數
總結
以上是生活随笔為你收集整理的Python3 爬虫学习笔记 C05 【Selenium + 无界面浏览器】的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 中信信金卡可以刷卡吗 中信信金卡怎么刷卡
- 下一篇: 信金宝需要信金卡吗