编写一个爬虫类库——(一)想法
生活随笔
收集整理的這篇文章主要介紹了
编写一个爬虫类库——(一)想法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
有的時候,我會寫一些爬蟲程序來自動獲取一些信息,之前一段時間用過Puppeteer來驅動Chrome獲取信息,我之前也寫過一系列文章來介紹它。Puppeteer是Google官方出品,本身質量非常好高,提供的功能也非常強大,但它本身并不是針對爬蟲程序定制的,用起來存在如下不便之處:
加上我也不是經常有些蜘蛛程序的需求,只是偶爾心血來潮的時候寫一下玩玩。導致每次使用都要在Puppeteer的API列表和我之前的博客文章中查一遍才能進行功能的開發。
另外,具體開發蜘蛛程序的時候,針對站點的數據解析比較費時費力,需要提供一個方便強大的調試工具。
基于以上原因,我變有了一個自己寫一個依托于Chrome,專門針對蜘蛛程序的類庫的想法,主要目標如下:
該工具我打算使用.net core來寫,有宇宙第一IDE加持的話,開發和后期使用時非常簡單的。我已經實現了一個小的原型了,雖然目前功能還不完善,但已經可以用來來實現一些簡單的數據爬取的。
由于最近的工作和家里的事情都比較多,后面的開發進度估計就要慢不少了,我后續也會寫一些文章介紹開發過程中的心得的。
轉載于:https://www.cnblogs.com/TianFang/p/11142993.html
總結
以上是生活随笔為你收集整理的编写一个爬虫类库——(一)想法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【转】android-修改TextVie
- 下一篇: Spring Boot:快速入门教程