node.js - nodejs代理IP發送HTTP請求
問題描述
問題解答
回答1:用request庫可以很方便這種任務,下面是我寫的一個獲取可用代理列表 + 用代理訪問目標網站的Demo
var request = require('request');var iconv = require(’iconv-lite’);var Promise = require('bluebird');function getProxyList() { var apiURL = ’http://www.66ip.cn/mo.php?sxb=&tqsl=100&port=&export=&ktip=&sxa=&submit=%CC%E1++%C8%A1&textarea=http%3A%2F%2Fwww.66ip.cn%2F%3Fsxb%3D%26tqsl%3D100%26ports%255B%255D2%3D%26ktip%3D%26sxa%3D%26radio%3Dradio%26submit%3D%25CC%25E1%2B%2B%25C8%25A1’; return new Promise((resolve, reject) => {var options = { method: ’GET’, url: apiURL, gzip: true, encoding: null, headers: {’Accept’: ’text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8’,’Accept-Encoding’: ’gzip, deflate’,’Accept-Language’: ’zh-CN,zh;q=0.8,en;q=0.6,zh-TW;q=0.4’,’User-Agent’: ’Mozilla/8.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36’,’referer’: ’http://www.66ip.cn/’ },};request(options, function (error, response, body) { try {if (error) throw error;if (/meta.*charset=gb2312/.test(body)) { body = iconv.decode(body, ’gbk’);}var ret = body.match(/d{1,3}.d{1,3}.d{1,3}.d{1,3}:d{1,4}/g);resolve(ret); } catch (e) {return reject(e); }}); })}getProxyList().then(function (proxyList) { var targetOptions = {method: ’GET’,url: ’http://ip.chinaz.com/getip.aspx’,timeout: 8000,encoding: null, }; //這里修改一下,變成你要訪問的目標網站 proxyList.forEach(function (proxyurl) {console.log(`testing ${proxyurl}`);targetOptions.proxy = ’http://’ + proxyurl;request(targetOptions, function (error, response, body) { try {if (error) throw error;body = body.toString();console.log(body);eval(`var ret = ${body}`);if (ret) { console.log(`驗證成功==>> ${ret.address}`);} } catch (e) {// console.error(e); }}); });}).catch(e => { console.log(e);})
那你首先得找到一堆代理啊,據我所知這種動態代理一般靠譜的都是收費的。具體思路就是請求代理提供商的接口獲得代理服務器列表,然后每次請求都隨機選一個作為代理
相關文章:
1. node.js - 在搭建vue.js時,安裝淘寶npm鏡像cnpm,報錯,如何解決呢2. mysql - 分庫分表、分區、讀寫分離 這些都是用在什么場景下 ,會帶來哪些效率或者其他方面的好處3. node.js - nodejs開發中常用的連接mysql的庫4. linux - python 抓取公眾號文章遇到驗證問題5. mysql - jdbc的問題6. python - 我在使用pip install -r requirements.txt下載時,為什么部分能下載,部分不能下載7. 視頻文件不能播放,怎么辦?8. mysql - 如何減少使用或者不用LEFT JOIN查詢?9. 網頁爬蟲 - python 爬取網站 并解析非json內容10. 為啥最大化個窗口還得找一堆理由?
