使用Excel功能抓取网页表格数据
? ? ? ?對于非工科專業(yè)的來說(例如文學歷史)學習爬蟲似乎沒有多少必要,在日常工作之中根據(jù)工作學習就可以時間一長,就可以直接使用的非常熟練了。
本文主要介紹使用Excel來抓取網(wǎng)頁的上面的數(shù)據(jù)。
示例鏈接:https://ranking.promisingedu.com/world-times
?
這上面這個表格之中,如果我采用復制,網(wǎng)頁的表格然后粘貼在了Excel由于數(shù)據(jù)量過大,顯的十分麻煩,下面我們簡單介紹一個神奇當然就是Excel,注意是微軟的版本,目前wps目前還沒有當前這個功能。
復制鏈接:?
打開Excel :
打開Excel之后,最好新建一個Excel文件,這樣的話比較方便,選擇數(shù)據(jù)選項卡,數(shù)據(jù)來源選擇【自網(wǎng)站】如果找不到的就選擇數(shù)據(jù)獲取源里面尋找。
抓取數(shù)據(jù):
粘貼鏈接到對話框點確定,連接選擇匿名即可
?
需要等待一段時間,在導航器之中選擇你需要的數(shù)據(jù)
?
點擊加載即可。
表格已經(jīng)生成了吧,下來只需要簡單處理數(shù)據(jù)就可以了。
這種方式最適合于單頁面多表格的形式,其中的原理主要采用是的使用Excel內(nèi)置的游覽器組件去下載給定鏈接之中的HTML頁面,從頁面之中解析表的數(shù)據(jù),包括表頭的數(shù)據(jù)部分,簡單易用。?
總結(jié)
以上是生活随笔為你收集整理的使用Excel功能抓取网页表格数据的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: file_put_contents()写
- 下一篇: es6--解构赋值