文章詳情頁

python - scrapy 爬取pages比實際進入items的多得多？

瀏覽：84日期：2022-07-23 10:55:26

2017-05-12 23:39:52 [scrapy.extensions.logstats] INFO:Crawled 3000 pages (at 61 pages/min), scraped 454 items (at 10 items/min)

為什么我使用scrapy爬取的時候訪問pages要比實際進入items的的多的多?就是爬了半天items里沒有幾條數據入庫的有什么辦法解決么？

問題解答

回答1：

重定向了，你看到了吧，重定向就得請求兩個頁面啊。還有就是看有不有頁面解析發生了錯誤。

Python 編程

上一條：算法 - python ahocorasick 從本地文件讀取文本，進行關鍵字匹配，匹配失敗下一條：運行python程序時出現“應用程序發生異?！钡膬却驽e誤？

相關文章：

1. javascript - h5 video層級太高導致浮在div上面，如何解決？2. mysql ER_BAD_DB_ERROR: Unknown database ’test’3. linux - Ubuntu下編譯Vim8（+python）無數次編譯失敗4. python - pyspider爬pdf爬了一小段時間后就不動了5. mysql - 記得以前在哪里看過一個估算時間的網站6. 如何合并兩張具有相同結構的mysql表7. javascript - Ajax加載Json時，移動端頁面向左上角縮小一截兒，加載完成后才正常顯示，這該如何解決？8. python中怎么對列表以區間進行統計？9. css - 請問B站頂部的模糊半透明導航條是怎么實現的呢？10. python運行后沒有任何反饋要怎么排查

排行榜

					
					javascript - 如何獲取未來元素的父元素在頁面中所有相同元素中是第幾個?
css - 請問B站頂部的模糊半透明導航條是怎么實現的呢？
mysql - 記得以前在哪里看過一個估算時間的網站
mysql  ER_BAD_DB_ERROR: Unknown database ’test’
javascript - 圖片無法正常加載
javascript - vue中自定義事件如何傳遞參數？
angular.js - angular 2 應用如何進行打包？如何使用gulp打包？
javascript - Ajax加載Json時，移動端頁面向左上角縮小一截兒，加載完成后才正常顯示，這該如何解決？
linux - Ubuntu下編譯Vim8（+python）無數次編譯失敗
python中怎么對列表以區間進行統計？
html5 - video ios不能播放怎么辦？
				

熱門標簽