html 时光网播放视频,mtime时光网电影资料库采集规则
經(jīng)過分析發(fā)現(xiàn),時光網(wǎng)的這個篩選結(jié)果頁面html中,是用
在篩選結(jié)果頁面通過抓去HTML代碼發(fā)現(xiàn)電影URL的常規(guī)方法在這里不管用,當然篩選結(jié)果頁的翻頁也不管用,因此需要用抓包工具把篩選結(jié)果的內(nèi)部列表頁URL找出來。如下:http://service.channel.mtime.com/service/search.mcs?Ajax_CallBack=true&Ajax_CallBackType=Mtime.Channel.Pages.SearchService&Ajax_CallBackMethod=SearchMovieByCategory&Ajax_CrossDomain=1&Ajax_RequestUrl=http%3A%2F%2Fmovie.mtime.com%2Fmovie%2Fsearch%2Fsection%2F%3Ftype%3D201%23pageIndex%32%26year%3D2011%26type%3D201&t=201210271753315856&Ajax_CallBackArgument0=&Ajax_CallBackArgument1=0&Ajax_CallBackArgument2=138&Ajax_CallBackArgument3=&Ajax_CallBackArgument4=0&Ajax_CallBackArgument5=0&Ajax_CallBackArgument6=0&Ajax_CallBackArgument7=0&Ajax_CallBackArgument8=&Ajax_CallBackArgument9=&Ajax_CallBackArgument10=&Ajax_CallBackArgument11=0&Ajax_CallBackArgument12=0&Ajax_CallBackArgument13=0&Ajax_CallBackArgument14=1&Ajax_CallBackArgument15=0&Ajax_CallBackArgument16=1&Ajax_CallBackArgument17=4&Ajax_CallBackArgument18=10&Ajax_CallBackArgument19=0
注意以上url中加紅加粗的參數(shù):
Ajax_CallBackArgument2=國家/地區(qū)ID
Ajax_CallBackArgument3=類型ID
Ajax_CallBackArgument9=年代ID,如果不過濾就為空
Ajax_CallBackArgument10=年代ID,如果不過濾就為空 (你沒看錯,10和9都是指年代,一樣的id)
Ajax_CallBackArgument18=頁碼,
用火車頭的批量/多頁模式添加采集地址,Ajax_CallBackArgument18=(*),如下圖:
在“采集網(wǎng)址規(guī)則”時,選擇手動:
最后注意控制下采集網(wǎng)址的線程和頻率,在你采集了幾十個列表后,mtime時光網(wǎng)會讓你輸入驗證碼,很煩,目前我沒想到用什么方法來避免這個驗證碼。
總結(jié)
以上是生活随笔為你收集整理的html 时光网播放视频,mtime时光网电影资料库采集规则的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 在Java中实现SFTP协议文件传输的两
- 下一篇: 分治法求全排列