文章詳情頁

網頁爬蟲 - python爬蟲，需要爬取的數據沒在網頁源代碼中，怎么處理？

瀏覽：146日期：2022-06-27 11:23:18

問題描述

我想抓取直播吧賽事的比分：直播吧鏈接，可是我用Scrapy只能抓取到日期，主客隊等。我的問題是：比分是不是通過Script加載出來的？是不是在這個腳本中bf4.js中？這種Request Method:GET的情況如何準確獲取出比分如下圖？通過開發者工具查看出的網頁源代碼如下：<li label='足球,中甲,武漢卓爾' data-time='2017-06-24 15:00'>15:00 <b>中甲第15輪</b> 云南麗江 <img src='https://duihui.qiumibao.com/zuqiu/yunnanlijiang.png' > <span> - </span> <img src='https://duihui.qiumibao.com/zuqiu/wuhanzhuoer.png' > 武漢卓爾 <a href='http://www.wxshucaidpc.com/zhibo/zuqiu/2017/0624yunnanlijiangvswuhanzhuoer.htm' target='_blank'>武漢文體廣州競賽 PPTV</a> <a target='_blank'>文字</a> <a target='_blank'>手機看直播</a> <a target='_blank'>比分</a> <a target='_blank'>歐冠足球新服</a> </li>

即<span> - </span>中比分沒顯示，如何才能抓取渲染完成出來的比分網頁呢？網頁爬蟲 - python爬蟲，需要爬取的數據沒在網頁源代碼中，怎么處理？

問題解答

回答1：

數據在https://bifen4pc.qiumibao.com/json/list.htm?74520

網頁爬蟲 - python爬蟲，需要爬取的數據沒在網頁源代碼中，怎么處理？

回答2：

那就使用Selenium 來獲取吧，

鏈接描述

Python 編程

上一條：python - 關于爬蟲爬取圖片的問題？下一條：python - 如何將文本文件的CR換行符換成LF換行符？

相關文章：

1. 網頁爬蟲 - Python爬蟲入門知識2. 網頁爬蟲 - python爬蟲翻頁問題，請問各位大神我這段代碼怎樣翻頁，還有價格要登陸后才能看到，應該怎么解決3. 網頁爬蟲 - python爬蟲爬圖，報錯<urlopen error no hsot given>.4. 網頁爬蟲 - Python爬蟲運行內存占用過高導致電腦停止響應5. 網頁爬蟲 - Python爬蟲如何正確判斷頁面是否可以爬取？6. 網頁爬蟲 - Python爬蟲返回狀態碼與實際情況不符？7. 網頁爬蟲 - python爬蟲用BeautifulSoup爬取<s>元素并寫入字典，但某些div下沒有這一元素，導致自動寫入下一條，如何解決？

排行榜

					
					javascript - 關于css絕對定位在ios瀏覽器被橡皮筋遮擋的問題
人工智能 - python 機器學習 醫療數據 怎么學
javascript - 使用 vuex-router-sync寄存路由信息，this.$router params 不能賦值？
如何解決Centos下Docker服務啟動無響應，且輸入docker命令無響應？
javascript - 責任具體在哪一方
angular.js - 在ng-option 里使用過濾器無效
html5 - 只用CSS如何實現input框的寬度隨框里輸入的內容長短自動適應？
html - mongoose里面的populate沒用？
css3 - 微信前端頁面遇到的transition過渡動畫的bug
javascript - 請問 chrome  為什么會重復加載圖片資源？
javascript - 正則匹配大于0，不大于16，不超過兩位小數
				

熱門標簽

国产综合久久一区二区三区