用java爬取杭电oj已ac代码
前言
電腦的硬盤突然壞了,新安裝的eclipse的代碼全沒(méi)了,后來(lái)發(fā)現(xiàn)杭電上已經(jīng)ac的代碼可以查看到,我是個(gè)有強(qiáng)迫癥的人,我寧愿做很多件不同的事也不愿意做一件相同的事(復(fù)制黏貼)許多次,所以就突發(fā)奇想,做個(gè)爬蟲爬取已經(jīng)ac的代碼。
實(shí)現(xiàn)
首先打開杭電的首頁(yè),這里有我想要的信息
這里,解決的問(wèn)題的序列號(hào)事我們想要的。查看網(wǎng)頁(yè)源碼
就在這里找到我們想要的信息,我們要將他存下來(lái),然后進(jìn)去分析。
接著隨便點(diǎn)擊一個(gè)進(jìn)去分析。
對(duì)這個(gè)圖片信息,注意鏈接是有規(guī)律的,通過(guò)簡(jiǎn)單拼湊就可以進(jìn)入,注意第一個(gè) run id這個(gè)信息,是需要分析抓取的,然后點(diǎn)擊code len的鏈接。
發(fā)現(xiàn)自己的代碼就在這。發(fā)現(xiàn)鏈接,就是通過(guò)run id拼湊而來(lái)。這樣思路就清晰了。
1:抓取主頁(yè)面,獲得題目號(hào)。
2:對(duì)于每個(gè)題目號(hào),拼湊地址進(jìn)入第二個(gè)界面,在分析爬取這里的run id。
3:通過(guò)run id號(hào)拼湊地址進(jìn)入有代碼的網(wǎng)頁(yè),在通過(guò)解析工具獲取代碼。
4:通過(guò)io傳輸傳到本地文件
5:ps(解析工具:jsoup)注意要通過(guò)f12抓取登陸過(guò)的cookie模擬登陸,因?yàn)橹慌酪淮?#xff0c;就直接抓取cookie值傳入。
附上代碼:
1:抓取主頁(yè)面
總結(jié)
以上是生活随笔為你收集整理的用java爬取杭电oj已ac代码的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 杭电1280java实现
- 下一篇: 操蛋的linux改mysql密码(105