文章詳情頁

python - beautifulsoup獲取網頁內容的問題

瀏覽：142日期：2022-06-30 08:43:35

問題描述

我要的是這個里面的內容<p class='talk-article__body talk-transcript__body'>

PYTHON代碼：

neirong=soup.find(’p’,{’class’:’talk-article__body talk-transcript__body’})

但是返回的結果是空。這個選擇器是不是寫錯了？

問題解答

回答1：

neirong=soup.find_all(’p’,class_=’talk-article__body talk-transcript__body’)

https://www.crummy.com/softwa...

回答2：

參照：https://www.crummy.com/softwa...中給出的說明，正確的使用方式是：neirong=soup.find(’p’,class_=’talk-article__body talk-transcript__body’)

為了獲取p包含的內容，進一步調用neirong.contents即可

回答3：

neirong = soup.select(’.talk-article__body.talk-transcript__body’)回答4：

你從瀏覽器看到的內容有js動態生成的,用bs匹配不到,我發現看到的比較奇怪的class名基本都是js生成的

回答5：

使用find_all吧,find不能用于class

回答6：

個人覺得用BeautifulSoup來解析網頁的時候，如果樓主打算通過css特性來進行元素的定位的話，最好還是使用soup.select()，這個方法可以用class的value當參數也可以用標簽的的attribute當參數，很方便，用于搜索單一標簽最好用，同時參數支持css選擇器字符串，比如：soup.select('#id > .class a.title').

soup.find()方法目前好像用的不多，不知道是不是BeautifulSoup4棄用了?，F在一般只要出現find，就是find_all()等方法。以上詳細參考“超級湯”的中文文檔：http://beautifulsoup.readthed...

Python 編程

上一條：python - 編碼問題求助下一條：python - 版本號對比方法優化

相關文章：

1. javascript - 關于css絕對定位在ios瀏覽器被橡皮筋遮擋的問題2. 人工智能 - python 機器學習醫療數據怎么學3. mysql - 分庫分表、分區、讀寫分離這些都是用在什么場景下，會帶來哪些效率或者其他方面的好處4. python - Django內使用filter過濾時間，只認年份不認月份是怎么回事？5. javascript - 請問 chrome 為什么會重復加載圖片資源？6. c++ - 請問MySQL_Connection::isReadOnly 怎么解決？7. css3 - 微信前端頁面遇到的transition過渡動畫的bug8. Python爬蟲如何爬取span和span中間的內容并分別存入字典里？9. python - 能通過CAN控制一部普通的家用轎車嗎？10. html5 - 只用CSS如何實現input框的寬度隨框里輸入的內容長短自動適應？

排行榜

					
					javascript - 關于css絕對定位在ios瀏覽器被橡皮筋遮擋的問題
python - Django內使用filter過濾時間，只認年份不認月份是怎么回事？
人工智能 - python 機器學習 醫療數據 怎么學
javascript - 使用 vuex-router-sync寄存路由信息，this.$router params 不能賦值？
如何解決Centos下Docker服務啟動無響應，且輸入docker命令無響應？
javascript - 責任具體在哪一方
angular.js - 在ng-option 里使用過濾器無效
html5 - 只用CSS如何實現input框的寬度隨框里輸入的內容長短自動適應？
html - mongoose里面的populate沒用？
css3 - 微信前端頁面遇到的transition過渡動畫的bug
javascript - 請問 chrome  為什么會重復加載圖片資源？
				

熱門標簽