网页抓取工具
簡介
? ? ? ?Webdup能夠把您想要瀏覽的信息(如網頁和圖片等)預先下載下來,保存在本地硬盤,使您可以從本地進行離線瀏覽,這樣不僅可以大大減少上網時間,降低上網費用,還可以加快瀏覽速度;并且將來無須上網就可以很方便地查閱這些信息。不僅如此, Webdup更提供了備份歷次下載記錄和比較完善的管理功能,使您能夠方便地分類保存和管理有價值的下載信息。
原理
? ? ? ?Webdup在下載項目時,從用戶設定的"起始地址"開始,如果下載下來的是網頁(即HTML文件),則對它進行分析,解析出該網頁中包含的所有鏈接,如果某個鏈接符合繼續下載的條件(根據用戶設定的"層數限制","URL過濾"和"文件過濾"等來進行判斷),則把該鏈接加入到下載隊列中等待下載。就這樣不斷的下載和解析,直到所有的鏈接都被下載且沒有新的需要下載的鏈接產生,項目下載結束。
功能
? ? ? ?支持HTTP和FTP下載,并支持HTTP和Socks5代理服務器;
? ? ? ?支持多線程下載;
? ? ? ?支持斷點續傳;
? ? ? ?可按URL和文件后綴名設置過濾,只下載所需文件;
? ? ? ?Webdup的過濾設置
? ? ? ?Webdup的過濾設置
? ? ? ?自動識別下載過的文件是否更新過,減少重復下載;
? ? ? ?可設置定時下載和定時停止;
? ? ? ?支持自動撥號和自動掛斷;
? ? ? ?可導出和導入項目文件,方便用戶交換網上資源;
? ? ? ?提供與瀏覽器(IE)的整合,方便快速地創建項目;
? ? ? ?支持項目和類別的拖拽操作,方便用戶分類管理項目;
? ? ? ?能自動識別操作系統的語言,按需顯示中文或英文。
?
總結
- 上一篇: Go语言自学系列 | golang包管理
- 下一篇: React-Native之轮播组件汇总