python爬取知乎热搜_python爬取知乎
大小: 1.59M
文件類型: .zip
金幣: 1
下載: 0 次
發(fā)布日期: 2021-01-30
資源簡介
此項目的功能是爬取知乎用戶信息以及人際拓撲關(guān)系,爬蟲框架使用scrapy,數(shù)據(jù)存儲使用mongo,下載這些數(shù)據(jù)感覺也沒什么用,就當為大家學習scrapy提供一個例子吧。
## 使用方法
### 本地運行
爬蟲程序依賴mongo和rabbitmq,因此這兩個服務(wù)必須正常運行和配置。為了加快下載效率,圖片下載是異步任務(wù),因此在啟動爬蟲進程執(zhí)行需要啟動異步worker,啟動方式是進入zhihu_spider/zhihu目錄后執(zhí)行下面命令:
資源截圖
代碼片段和文件信息
#?-*-?coding=utf8?-*-
from?scrapy?import?cmdline
cmdline.execute(“scrapy?crawl?zhihu“.split())
屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
目錄???????????0??2016-03-20?14:42??zhihu_spider-master\
文件??????????30??2016-03-20?14:42??zhihu_spider-master\.gitignore
文件????????3056??2016-03-20?14:42??zhihu_spider-master\README.md
目錄???????????0??2016-03-20?14:42??zhihu_spider-master\doc\
文件??????753450??2016-03-20?14:42??zhihu_spider-master\doc\image.png
文件??????532877??2016-03-20?14:42??zhihu_spider-master\doc\people.png
文件??????413151??2016-03-20?14:42??zhihu_spider-master\doc\relation.png
文件??????126198??2016-03-20?14:42??zhihu_spider-master\doc\主頁.png
文件??????111628??2016-03-20?14:42??zhihu_spider-master\doc\代碼.png
文件????????3386??2016-03-20?14:42??zhihu_spider-master\doc\流程圖.graffle
文件???????97151??2016-03-20?14:42??zhihu_spider-master\doc\流程圖.png
文件?????????232??2016-03-20?14:42??zhihu_spider-master\docker-compose.yml
文件??????????60??2016-03-20?14:42??zhihu_spider-master\requirements.txt
目錄???????????0??2016-03-20?14:42??zhihu_spider-master\zhihu\
文件??????????96??2016-03-20?14:42??zhihu_spider-master\zhihu\main.py
文件?????????254??2016-03-20?14:42??zhihu_spider-master\zhihu\scrapy.cfg
目錄???????????0??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\
文件???????????0??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\__init__.py
文件?????????686??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\constants.py
文件????????1092??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\items.py
文件????????2536??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\pipelines.py
文件????????3654??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\settings.py
目錄???????????0??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\spiders\
文件?????????161??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\spiders\__init__.py
文件????????7657??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\spiders\profile.py
目錄???????????0??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\tools\
文件??????????44??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\tools\__init__.py
文件?????????696??2016-03-20?14:42??zhihu_spider-master\zhihu\zhihu\tools\async.py
總結(jié)
以上是生活随笔為你收集整理的python爬取知乎热搜_python爬取知乎的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 80后冲入“剩女”阵营
- 下一篇: python学习之手把手教你将图片变成黑