文章詳情頁

python - scrapy抓取知網response的內容重復

瀏覽：98日期：2022-06-27 08:47:44

問題描述

遍歷請求翻頁的url

for i in range(3): yield Request('http:xx/page/%s'%str(i),callback=self.parse_page)

結果response請求成功但是每次內容都一樣的沒變化都是第一次請求時的內容，但是用postman分別請求分頁的url就沒有這問題。= = 是被ban了嗎之前就不會這樣

問題解答

回答1：

那就要分析一下用postman或者瀏覽器訪問時請求的header頭和用scrapy請求頭有什么區別

回答2：

被反爬識別到了

回答3：

看下控制臺打印的log，看看是否正確抓取了下一頁2017-06-29 09:26:13 [scrapy] DEBUG: Scraped from <200 http:xx/page/x>,注意最后一個x(http:xx/page/x)是否是變化的

Python 編程

上一條：PC端訪問卻變成移動端地址問題#python#scrapy下一條：【python小白】問關于導入嵌套的包的問題

相關文章：

1. mysql的主從復制、讀寫分離，關于從的問題2. MySQL 截短某一列的字符串3. mysql - 字符串根據字典替換4. node.js - nodejs開發中常用的連接mysql的庫5. 視頻文件不能播放，怎么辦？6. mysql - 把一個表中的數據count更新到另一個表里?7. mysql - 分庫分表、分區、讀寫分離這些都是用在什么場景下，會帶來哪些效率或者其他方面的好處8. 請教使用PDO連接MSSQL數據庫插入是亂碼問題?9. 雙擊安裝程序，安裝不了10. mysql 查詢身份證號字段值有效的數據

排行榜

					
					node.js - npm init無法一直回車。到version就卡主不動了
雙擊安裝程序，安裝不了
解決Android webview設置cookie和cookie丟失的問題
javascript - 關于css絕對定位在ios瀏覽器被橡皮筋遮擋的問題
MySQL 截短某一列的字符串
visual-studio - Python OpenCV: 奇怪的自動補全問題
mysql的主從復制、讀寫分離，關于從的問題
javascript - 移動端自適應
python - 我在使用pip install -r requirements.txt下載時，為什么部分能下載，部分不能下載
docker安裝后出現Cannot connect to the Docker daemon.
docker內創建jenkins訪問另一個容器下的服務器問題
				

熱門標簽