文章詳情頁
網頁爬蟲 - Python爬蟲返回狀態碼與實際情況不符?
瀏覽:187日期:2022-09-03 18:57:11
問題描述
import urllib2opener = urllib2.build_opener()html = Noneresponse = Noneresponse = opener.open(’http://www.sxxrcs.com/was5/web/’)html = response.codeprint html
比如這個爬蟲,輸出狀態碼是200。
可是直接訪問http://www.sxxrcs.com/was5/web/是404,抓包響應的也是404,請問這是為什么?
問題解答
回答1:用requests吧
import requestsr = requests.get(’http://www.sxxrcs.com/was5/web/’)print r.status_codeprint r.text回答2:
200正常啊,requests方便快捷。
相關文章:
1. mysql - 分庫分表、分區、讀寫分離 這些都是用在什么場景下 ,會帶來哪些效率或者其他方面的好處2. javascript - vue-echarts-v3使用的過程中折線圖區域呈漸變色。3. 人工智能 - python 機器學習 醫療數據 怎么學4. 關于Mysql聯合查詢5. 如何修改phpstudy的phpmyadmin放到其他地方6. c++ - 請問MySQL_Connection::isReadOnly 怎么解決?7. python 計算兩個時間相差的分鐘數,超過一天時計算不對8. 索引 - 請教下Mysql大數據量的聯合查詢9. pip安裝提示Twisted錯誤問題(Python3.6.4安裝Twisted錯誤)10. 爬蟲圖片 - 關于Python 爬蟲的問題
排行榜
