• <fieldset id="8imwq"><menu id="8imwq"></menu></fieldset>
  • <bdo id="8imwq"><input id="8imwq"></input></bdo>
    最新文章專題視頻專題問答1問答10問答100問答1000問答2000關鍵字專題1關鍵字專題50關鍵字專題500關鍵字專題1500TAG最新視頻文章推薦1 推薦3 推薦5 推薦7 推薦9 推薦11 推薦13 推薦15 推薦17 推薦19 推薦21 推薦23 推薦25 推薦27 推薦29 推薦31 推薦33 推薦35 推薦37視頻文章20視頻文章30視頻文章40視頻文章50視頻文章60 視頻文章70視頻文章80視頻文章90視頻文章100視頻文章120視頻文章140 視頻2關鍵字專題關鍵字專題tag2tag3文章專題文章專題2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章專題3
    問答文章1 問答文章501 問答文章1001 問答文章1501 問答文章2001 問答文章2501 問答文章3001 問答文章3501 問答文章4001 問答文章4501 問答文章5001 問答文章5501 問答文章6001 問答文章6501 問答文章7001 問答文章7501 問答文章8001 問答文章8501 問答文章9001 問答文章9501
    當前位置: 首頁 - 科技 - 知識百科 - 正文

    node如何爬取網頁中的圖片(附代碼)

    來源:懂視網 責編:小采 時間:2020-11-27 19:32:11
    文檔

    node如何爬取網頁中的圖片(附代碼)

    node如何爬取網頁中的圖片(附代碼):本篇文章給大家帶來的內容是關于node如何爬取網頁中的圖片(附代碼),有一定的參考價值,有需要的朋友可以參考一下,希望對你有所幫助。目錄安裝node,并下載依賴搭建服務請求我們要爬取的頁面,返回json安裝node我們開始安裝node,可以去node官網下載h
    推薦度:
    導讀node如何爬取網頁中的圖片(附代碼):本篇文章給大家帶來的內容是關于node如何爬取網頁中的圖片(附代碼),有一定的參考價值,有需要的朋友可以參考一下,希望對你有所幫助。目錄安裝node,并下載依賴搭建服務請求我們要爬取的頁面,返回json安裝node我們開始安裝node,可以去node官網下載h
    本篇文章給大家帶來的內容是關于node如何爬取網頁中的圖片(附代碼),有一定的參考價值,有需要的朋友可以參考一下,希望對你有所幫助。

    目錄

  • 安裝node,并下載依賴

  • 搭建服務

  • 請求我們要爬取的頁面,返回json

  • 安裝node

    我們開始安裝node,可以去node官網下載https://nodejs.org/zh-cn/,下載完成后運行node使用,

    node -v

    安裝成功后會出現你所安裝的版本號。

    接下來我們使用node, 打印出hello world,新建一個名為index.js文件輸入

    console.log('hello world')

    運行這個文件

    node index.js

    就會在控制面板上輸出hello world

    搭建服務器

    新建一個·名為node的文件夾。

    首先你需要下載express依賴

    npm install express

    再新建一個名為demo.js的文件 目錄結構如圖:

    在demo.js引入下載的express

    const express = require('express');
    const app = express();
    app.get('/index', function(req, res) {
    res.end('111')
    })
    var server = app.listen(8081, function() {
     var host = server.address().address
     var port = server.address().port
     console.log("應用實例,訪問地址為 http://%s:%s", host, port)
    
    })

    運行node demo.js簡單的服務就搭起來了,如圖:

    請求我們要爬取的頁面

    請求我們要爬取的頁面

    npm install superagent
    npm install superagent-charset
    npm install cheerio

    superagent 是用來發起請求的,是一個輕量的,漸進式的ajax api,可讀性好,學習曲線低,內部依賴nodejs原生的請求api,適用于nodejs環境下.,也可以使用http發起請求

    superagent-charset防止爬取下來的數據亂碼,更改字符格式

    cheerio為服務器特別定制的,快速、靈活、實施的jQuery核心實現.。 安裝完依賴就可以引入了

    var superagent = require('superagent');
    var charset = require('superagent-charset');
    charset(superagent);
    const cheerio = require('cheerio');

    引入之后就請求我們的地址,https://www.qqtn.com/tx/weixintx_1.html,如圖:

    聲明地址變量:

    const baseUrl = 'https://www.qqtn.com/'

    這些設置完之后就是發請求了,接下來請看完整代碼demo.js

    var superagent = require('superagent');
    var charset = require('superagent-charset');
    charset(superagent);
    var express = require('express');
    var baseUrl = 'https://www.qqtn.com/'; //輸入任何網址都可以
    const cheerio = require('cheerio');
    var app = express();
    app.get('/index', function(req, res) {
     //設置請求頭
     res.header("Access-Control-Allow-Origin", "*");
     res.header('Access-Control-Allow-Methods', 'PUT, GET, POST, DELETE, OPTIONS');
     res.header("Access-Control-Allow-Headers", "X-Requested-With");
     res.header('Access-Control-Allow-Headers', 'Content-Type');
     //類型
     var type = req.query.type;
     //頁碼
     var page = req.query.page;
     type = type || 'weixin';
     page = page || '1';
     var route = `tx/${type}tx_${page}.html`
     //網頁頁面信息是gb2312,所以chaeset應該為.charset('gb2312'),一般網頁則為utf-8,可以直接使用.charset('utf-8')
     superagent.get(baseUrl + route)
     .charset('gb2312')
     .end(function(err, sres) {
     var items = [];
     if (err) {
     console.log('ERR: ' + err);
     res.json({ code: 400, msg: err, sets: items });
     return;
     }
     var $ = cheerio.load(sres.text);
     $('div.g-main-bg ul.g-gxlist-imgbox li a').each(function(idx, element) {
     var $element = $(element);
     var $subElement = $element.find('img');
     var thumbImgSrc = $subElement.attr('src');
     items.push({
     title: $(element).attr('title'),
     href: $element.attr('href'),
     thumbSrc: thumbImgSrc
     });
     });
     res.json({ code: 200, msg: "", data: items });
     });
    });
    var server = app.listen(8081, function() {
    
     var host = server.address().address
     var port = server.address().port
    
     console.log("應用實例,訪問地址為 http://%s:%s", host, port)
    
    })

    運行demo.js就會返回我們拿到的數據,如圖:

    一個簡單的node爬蟲就完成了。

    聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

    文檔

    node如何爬取網頁中的圖片(附代碼)

    node如何爬取網頁中的圖片(附代碼):本篇文章給大家帶來的內容是關于node如何爬取網頁中的圖片(附代碼),有一定的參考價值,有需要的朋友可以參考一下,希望對你有所幫助。目錄安裝node,并下載依賴搭建服務請求我們要爬取的頁面,返回json安裝node我們開始安裝node,可以去node官網下載h
    推薦度:
    標簽: 的圖片 網站 網頁
    • 熱門焦點

    最新推薦

    猜你喜歡

    熱門推薦

    專題
    Top
    主站蜘蛛池模板: 国产探花在线精品一区二区| 国产精品伦理久久久久久| 成人精品一区二区三区免费看| 日韩精品一区二区三区中文| 99久久精品这里只有精品| 2020久久精品国产免费| 亚洲国产成人精品无码区在线观看| 国产精品免费视频观看拍拍| avtt天堂网久久精品| 亚洲精品乱码久久久久久| 久久精品亚洲福利| 国产精品无码免费专区午夜| 久久久久夜夜夜精品国产| 69国产成人综合久久精品| 久久亚洲日韩精品一区二区三区| 亚洲精品一级无码鲁丝片| 精品中文高清欧美| 国产一区二区精品久久凹凸| 99精品福利国产在线| 桃花岛精品亚洲国产成人| 大桥未久在线精品视频在线| 国产亚洲欧美精品永久| 久久精品国产第一区二区三区 | CAOPORM国产精品视频免费| 熟妇人妻VA精品中文字幕| 亚洲中文久久精品无码| 亚洲国产成人a精品不卡在线| 日本精品视频在线观看| 精品无码久久久久久久久久 | 一本大道久久a久久精品综合| 精品国产福利第一区二区三区| 精品国产欧美一区二区| 久久福利青草精品资源站免费| 国产精品欧美日韩| 热久久这里只有精品| 99久久精品九九亚洲精品| 国产精品热久久无码av| 久久午夜无码鲁丝片午夜精品| 久久青青草原精品国产软件 | 精品少妇一区二区三区在线| 精品无码久久久久久久久久|