文章詳情頁

使用python scrapy框架,循環爬取URL, 每次運行一段時間后直接卡死,沒有任何報錯

瀏覽：80日期：2022-06-28 18:15:35

問題描述

每次運行半小時左右, 直接卡死, log里沒有任何報錯, 卡死的時候CPU占用率非常高

我在setting.py里設置了download timeout,不是超時的原因

ctrl-c無法正常退出, ctrl-z退出以后, 繼續執行還是同樣的問題, 半小時后再次卡死

使用python scrapy框架,循環爬取URL, 每次運行一段時間后直接卡死,沒有任何報錯

問題解答

回答1：

先TOP看看是內否過高，還是CPU過高，再找到是被哪些進程占用了如果都是你的爬蟲進程，那就得排查代碼，看看是不是哪里一直未被釋放

總之從各方面去排查吧

回答2：

strace

Python 編程

上一條：python2 qt5 關于如何判斷字符串為空下一條：python - dateutil.parser 處理不完整時間字符串

排行榜

					
					docker-compose 為何找不到配置文件？
boot2docker無法啟動
ddos - apache日志很多其它網址，什么情況？
請問一下各位老鳥 我一直在學習獨孤九賤 現在是在tp5 今天發現 這個系列視頻沒有實戰
tp6 事務閉包操作問題
android - E/dalvikvm: Could not find class java.nio.file.Path,
python - linux怎么在每天的凌晨2點執行一次這個log.py文件
docker不顯示端口映射呢？
android - 哪位大神知道java后臺的api接口的對象傳到前端后輸入日期報錯，是什么情況？求大神指點
這是什么情況？？？
html - 這種錯位的時間軸怎么布局，然后用css實現？
				

熱門標簽