爬虫实现自动登陆抽屉网,实现对文章点赞,收藏,评论
抽屜網(wǎng)比較特別,一般的網(wǎng)站在登陸的時(shí)候會(huì)返回一個(gè)cookies,以后再次登陸的時(shí)候只要帶著這個(gè)cookies去登陸就可以,但是抽屜網(wǎng)得特別之處在于登陸后返回給用戶得cookies是沒用得,這是抽屜網(wǎng)做出來混淆視聽得一種做法
正解
我們第一次打開抽屜網(wǎng)得時(shí)候,用get請求發(fā)送,這時(shí)候其實(shí)抽屜網(wǎng)會(huì)返回一個(gè)cookies在
然后在此頁面進(jìn)行登陸的時(shí)候,發(fā)送post請求,其實(shí)就是對get請求返回得cookies進(jìn)行授權(quán),登陸名和密碼登陸成功,也就是授權(quán)cookies,然后就可以用這個(gè)cookies進(jìn)行自動(dòng)登陸或者點(diǎn)贊等。
發(fā)送post請求得時(shí)候其實(shí)也會(huì)返回一個(gè)cookies,但是這個(gè)cookies是無用得,所以正確得cookies應(yīng)該是第一次拿到得cookies才可以正確登陸
登陸
后臺(tái)模擬自動(dòng)登陸抽屜網(wǎng),自動(dòng)獲取cookies然后自動(dòng)登陸執(zhí)行操作
注意
第二次登陸發(fā)送post請求時(shí),應(yīng)該將第一次得cookies帶過去,授權(quán),所以要帶著cookies,為了模擬瀏覽器得行為,每次都要帶著請求頭去這樣這樣不會(huì)容易被發(fā)現(xiàn)是爬蟲。
除了實(shí)現(xiàn)自動(dòng)登陸和點(diǎn)贊之外,其實(shí)對于文章進(jìn)行評論和文章收藏和文章點(diǎn)贊得實(shí)現(xiàn)方法是一樣得。
對文章點(diǎn)贊
在點(diǎn)贊得時(shí)候,按住F12進(jìn)行檢查,然后點(diǎn)到network中,觀察點(diǎn)贊時(shí)得變化,將點(diǎn)贊得鏈接地址拷貝下來,復(fù)制到post中得url上就可以實(shí)現(xiàn)對文章得點(diǎn)贊
對文章收藏
方法一樣,不多說
對文章評論
對文章進(jìn)行評論多了一步,就是發(fā)送評論得內(nèi)容,所以要定義一個(gè)數(shù)據(jù)列表來存放評論得內(nèi)容,還要定義要評論文章得id,這個(gè)可以從網(wǎng)頁得源代碼中找到,以下就是在評論得時(shí)候network得變化
其實(shí)主要看creat就行,connect不用看的,其中content就是自己要評論得內(nèi)容,linkid就是要評論得文章得id,其余照抄不動(dòng),代碼如下
總結(jié)
以上是生活随笔為你收集整理的爬虫实现自动登陆抽屉网,实现对文章点赞,收藏,评论的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【LeetCode】825. Frien
- 下一篇: springMVC实现jsonp的跨域请