文章詳情頁
python - 我該怎么寫正則?
瀏覽:109日期:2022-06-30 09:24:08
問題描述
s = u’ud83dudc8b’co = re.compile( u’ud83dudc8b’)co.sub(u’’,s)print(u’ud83d’)
輸出如下UnicodeEncodeError: ’utf-8’ codec can’t encode character ’ud83d’ in position 0: surrogates not allowed
s中大概是一個微博表情,搞了一下午怎么都顯示不出來,想著替換掉算了然后怎么都沒法匹配到,為什么呢
問題解答
回答1:首先,是2個問題1.為什么顯示不出來2.想替換掉但是為什么匹配不到
回答1.特殊編碼在終端上是無法顯示的,如果是在UI上顯示,那么需要把UI的encoding設置好。2.試試下面的代碼
import res = u’hello ud83dudc8b world’co = re.compile( u’ud83dudc8b’)ss = co.sub(u’’,s)print(ss)
運行結果:hello world
回答2:我都是抄的
相關文章:
排行榜
