當前位置:
首頁 >
前端技术
> javascript
>内容正文
javascript
NodeJS 爬取lol英雄数据信息
生活随笔
收集整理的這篇文章主要介紹了
NodeJS 爬取lol英雄数据信息
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1、安裝node.js??Node.js官網?
?2、直接上代碼
?
var http = require('http'); var fs = require('fs'); // 文件系統模塊var cheerio = require('cheerio'); // 抓取網頁數據模塊,需要安裝,npm install cheerio var url = 'http://lol.duowan.com/hero/'; // 我要爬取的網站http.get(url, function(res) {var html = '';res.on('data', function(data) {html += data;});res.on('end', function(){// console.log(html); // 獲取到的網頁源碼filterChapters(html);}) }).on('error', function() {console.log('獲取網頁源碼失敗....'); })function filterChapters(html) {var $ = cheerio.load(html); var element = $('.champion_tooltip');var heroNames = element.children('h2'); // 通過選擇器查找元素var heroAliass = element.find('h3');var heroIntroduces = element.find('p');var heroTypes = element.find('span');// 英雄對象 // 對象數組var hero = {}, heros = []; var sql;var str;for (var i = 0; i < heroNames.length; i++) {sql = 'insert into lolhero(heroName, heroAlias, heroIntroduce, heroType) ' + ' values (\''+$(heroNames[i]).text()+'\',\''+$(heroAliass[i]).text()+'\',\''+$(heroIntroduces[i]).text()+'\',\''+$(heroTypes[i]).text()+'\');';hero = {heroName : $(heroNames[i]).text(),heroAlias : $(heroAliass[i]).text(),heroIntroduce : $(heroIntroduces[i]).text(),heroType : $(heroTypes[i]).text()}// 返回json數組heros.push(hero);// 返回sql語句str += sql;}// 將所有的英雄信息生成sql語句var out = fs.createWriteStream('./sql.txt')out.write(str);console.log(heros.length);console.log(str); }3、創建數據庫 Mysql
DROP TABLE IF EXISTS `lolhero`; CREATE TABLE `lolhero` (`id` int(11) NOT NULL AUTO_INCREMENT,`heroName` varchar(50) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,`heroAlias` varchar(50) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,`heroIntroduce` varchar(500) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,`heroType` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,PRIMARY KEY (`id`) USING BTREE )?4、有一點要注意的:爬取出來的數據,有的會多一個? '? 號導致數據錯誤,如下圖:
5、大功告成,初學所寫,勿見怪?....
?
總結
以上是生活随笔為你收集整理的NodeJS 爬取lol英雄数据信息的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ubuntu18.04 alt+ctrl
- 下一篇: What's the differenc