抓取AJAX网页的方法-Firefox组件,C#集成
生活随笔
收集整理的這篇文章主要介紹了
抓取AJAX网页的方法-Firefox组件,C#集成
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
現在AJAX的使用越來越廣泛了,但是如果經常寫網頁抓取程序的人會發現,很多網頁內容是通用AJAX進行加載的,實際抓取到的內容寥寥無幾。
通過網絡到處查找方法,發現用firefox瀏覽器能夠正常把AJAX內容通過HTML呈現出來,那么是否意味著我們獲取AJAX網頁有希望了?
功夫不負有心人,進一步研究發現,firefox確實有一款C#組件,可以用C#集成到桌面程序中。
1)需要引用一個叫Skybound.Gecko.dll的文件。
2)此外還需要導入一個firefox支持的文件夾,代碼如下:
Xpcom.Initialize(@"C:\xulrunner-1.9.1.14.en-US.win32.sdk\xulrunner-sdk\bin");
xulrunner-1.9.1.14.en-US.win32.sdk這個文件夾比較大,壓縮后都有二十多M,無法上傳,可以去google一下,但是記得一定要搜這個名字,因為我試過其它的有些不能用。
3)直接指定URL就可以訪問網站了,可以通過this.geckoWebBrowser1.Navigate(URL);來指定。還有很多功能,自己去發現吧。
?
轉載于:https://www.cnblogs.com/zzy2740/archive/2011/09/25/2190029.html
總結
以上是生活随笔為你收集整理的抓取AJAX网页的方法-Firefox组件,C#集成的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 学习Asp.Net经常会用到的函数集
- 下一篇: 如何发现需求