python去除刪除數據中u0000u0001等unicode字符串的代碼
py文件為utf-8格式
#!/usr/bin/env python# -*- coding:utf-8 -*- a = 'systemu0000' b = re.sub(u’u0000’, '', a) print(b) ## b='system'
補充知識:Python中,如何將反斜杠u類型(uXXXX)的字符串,轉換為對應的unicode的字符
【背景】
類似于:
u3232u6674 的字符串,轉換為對應的unicode字符。
【解決過程】
對應的,可以通過Python的decode函數去解碼,其中自定原始字符串位unicode-ecape,就可以了。
完整的python代碼演示為:
#!/usr/bin/python #coding: utf-8slashUStr = 'u0063u0072u0069u0066u0061u006Eu0020u5728u8DEFu4E0A'; #crifan 在路上 decodedUniChars = slashUStr.decode('unicode-escape') print 'decodedUniChars=',decodedUniChars; #decodedUniChars= crifan 在路上
以上這篇python去除刪除數據中u0000u0001等unicode字符串的代碼就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持好吧啦網。
相關文章:
