文章詳情頁

python - Scrapy中xpath用到中文報錯

瀏覽：122日期：2022-06-27 08:01:12

問題描述

問題描述

links = sel.xpath(’//i[contains(@title,'置頂')]/following-sibling::a/@href’).extract()

報錯：ValueError: All strings must be XML compatible: Unicode or ASCII, no NULL bytes or control characters

問題解答

回答1：

參見文章：解決Scrapy中xpath用到中文報錯問題

解決方法

方法一：將整個xpath語句轉成Unicode

links = sel.xpath(u’//i[contains(@title,'置頂')]/following-sibling::a/@href’).extract()

方法二：xpath語句用已轉成Unicode的title變量

title = u'置頂'links = sel.xpath(’//i[contains(@title,'%s')]/following-sibling::a/@href’ %(title)).extract()

方法三：直接用xpath中變量語法($符號加變量名)$title, 傳參title即可

links = sel.xpath(’//i[contains(@title,$title)]/following-sibling::a/@href’,).extract()回答2：

整個字符串前加個u試試

Python 編程

上一條：求大神解讀一段神級的Python代碼，謝謝??！下一條：python for循環中的函數只能運行一次？

相關文章：

1. mysql - 把一個表中的數據count更新到另一個表里?2. mysql - 分庫分表、分區、讀寫分離這些都是用在什么場景下，會帶來哪些效率或者其他方面的好處3. mysql replace 死鎖4. MySQL 截短某一列的字符串5. 視頻文件不能播放，怎么辦？6. node.js - nodejs開發中常用的連接mysql的庫7. mysql 查詢身份證號字段值有效的數據8. 請教使用PDO連接MSSQL數據庫插入是亂碼問題?9. 雙擊安裝程序，安裝不了10. mysql - 字符串根據字典替換

排行榜

					
					node.js - npm init無法一直回車。到version就卡主不動了
雙擊安裝程序，安裝不了
解決Android webview設置cookie和cookie丟失的問題
javascript - 關于css絕對定位在ios瀏覽器被橡皮筋遮擋的問題
MySQL 截短某一列的字符串
visual-studio - Python OpenCV: 奇怪的自動補全問題
javascript - 移動端自適應
python - 我在使用pip install -r requirements.txt下載時，為什么部分能下載，部分不能下載
docker安裝后出現Cannot connect to the Docker daemon.
docker內創建jenkins訪問另一個容器下的服務器問題
debian - docker依賴的aufs-tools源碼哪里可以找到??？
				

熱門標簽