您的位置:首頁技術文章
文章詳情頁

python - 要抓取的網頁內容在括號里,正則怎么寫?

瀏覽:89日期:2022-09-02 08:56:00

問題描述

<dt> <span class='gray6 '>名稱:</span> <a target='_blank'>安現</a> ( <a href='http://www.wxshucaidpc.com/ho-a021551/' target='_blank'> 中間 </a><a href='http://www.wxshucaidpc.com/ho-a011551-b03497/' target='_blank'> 草原牧場 #這是我要抓取的內容我把它放到組(.*?)里面。 </a> ) [ <a href='http://www.wxshucaidpc.com/wenda/acchor'>圖文</a> ] </dt>

我就是想抓取第9行那里的中文內容,放到一個組里面。本來應該很簡單,但是試了好多次就是抓不到,報錯是沒有內容。估計和第5行,和11行的括號有關。請問怎么寫正則才能抓得到?我原來這樣寫

d = re.search(r’<a id='agatdesf_B02_10'.*?>s*(.*?)s*</a>’, s).group(1)

抓不到,誰幫我看下錯在哪里?

問題解答

回答1:

python3

html=’’’ <dt> <span class='gray6 '>名稱:</span> <a target='_blank'>安現</a> ( <a href='http://www.wxshucaidpc.com/ho-a021551/' target='_blank'> 中間 </a><a href='http://www.wxshucaidpc.com/ho-a011551-b03497/' target='_blank'> 草原牧場 #這是我要抓取的內容我把它放到組(.*?)里面。 </a> ) [ <a href='http://www.wxshucaidpc.com/wenda/acchor'>圖文</a> ] </dt>’’’import rep=re.compile(r’<as+?[^>]*?id='agatdesf_B02_10'[^>]*>([^<]*)</a>’)print(p.findall(html)[0].strip())##草原牧場 #這是我要抓取的內容我把它放到組(.*?)里面?;卮?:

推薦一本書 精通正則表達式 看看就都會了!

標簽: Python 編程
国产综合久久一区二区三区