文章詳情頁

python - pythoh3 下 ’<abc>’ 遇到這樣的html轉義符如何自動轉義呢？

瀏覽：62日期：2022-06-28 18:47:10

問題描述

初學python，在使用scray 爬蟲時，遇到html的特殊字符，于是百度搜看了下文檔：

import HTMLParser html_parser = HTMLParser.HTMLParser() s = ’&l t;abc&g t;&nbs p;’ #避免網頁轉義留了個空格s = html_parser.unescape(s)

運行時提示：import markupbaseImportError: No module named ’markupbase’

借助翻譯軟件，看HTMLParser官方文檔找了第二種方法

from html.parser import HTMLParser

class MyHTMLParser(HTMLParser):

def handle_data(self, data): print(data) return data

parser = MyHTMLParser()s = ’&l t;abc&g t;&nbs p;’ #避免網頁轉義留了個空格ss=parser.feed(s)

第二種方法測試成功，遇到的問題是，return data 這一句，返回數據是無效的？

請問，有沒有就幾句代碼解決轉義的，如果沒有第二種方法里如何才有返回值？

問題解答

回答1：

from html.parser import HTMLParserhtml_parser = HTMLParser()s = ’<abc> ’txt = html_parser.unescape(s)print(txt)# 結果：<abc>

Python 編程

上一條：python - Django中如何使用異步下一條：python - ubuntu16.04 lxml的報錯

相關文章：

1. 前端 - node vue webpack項目文件結構2. 如何分別在Windows下用Winform項模板+C#，在MacOSX下用Cocos Application項目模板+Objective-C實現一個制作游戲的空的黑窗口？3. html5和Flash對抗是什么情況？4. php如何獲取訪問者路由器的mac地址5. javascript - 在 vue里面用import引入js文件，結果為undefined6. Java反射問題：為什么android.os.Message的recycleUnchecked方法不能通過反射獲取到？7. 小程序怎么加外鏈，語句怎么寫！求救新手，開文檔沒發現8. python - linux怎么在每天的凌晨2點執行一次這個log.py文件9. javascript - vue-resource中如何設置全局的timeout？10. thinkPHP5中獲取數據庫數據后默認選中下拉框的值，傳遞到后臺消失不見。有圖有代碼，希望有人幫忙

排行榜

					
					python - linux怎么在每天的凌晨2點執行一次這個log.py文件
javascript - vue-resource中如何設置全局的timeout？
html5和Flash對抗是什么情況？
php如何獲取訪問者路由器的mac地址
如何分別在Windows下用Winform項模板+C#，在MacOSX下用Cocos Application項目模板+Objective-C實現一個制作游戲的空的黑窗口？
小程序怎么加外鏈，語句怎么寫！求救新手，開文檔沒發現
前端 - node vue webpack項目文件結構
javascript -  在 vue里面用import引入js文件，結果為undefined
Java反射問題：為什么android.os.Message的recycleUnchecked方法不能通過反射獲取到？
html5 - input type=’file’ 上傳獲取的fileList對象怎么存儲于瀏覽器？
javascript - 如何獲取未來元素的父元素在頁面中所有相同元素中是第幾個?
				

熱門標簽

国产综合久久一区二区三区