您的位置:首頁技術文章
文章詳情頁

網頁爬蟲 - Python爬蟲返回狀態碼與實際情況不符?

瀏覽:187日期:2022-09-03 18:57:11

問題描述

import urllib2opener = urllib2.build_opener()html = Noneresponse = Noneresponse = opener.open(’http://www.sxxrcs.com/was5/web/’)html = response.codeprint html

比如這個爬蟲,輸出狀態碼是200。

網頁爬蟲 - Python爬蟲返回狀態碼與實際情況不符?

可是直接訪問http://www.sxxrcs.com/was5/web/是404,抓包響應的也是404,請問這是為什么?

網頁爬蟲 - Python爬蟲返回狀態碼與實際情況不符?

問題解答

回答1:

用requests吧

import requestsr = requests.get(’http://www.sxxrcs.com/was5/web/’)print r.status_codeprint r.text回答2:

200正常啊,requests方便快捷。

標簽: Python 編程
相關文章:
国产综合久久一区二区三区