Python:如何将utf-8代码字符串转换回字符串?
我正在使用Python,不幸的是,我的代码需要将代表字符串的utf-8代码的字符串转换为原始字符串,例如:
我从其他代码获得的UTF-8代码字符串:
\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5
我需要将其转换回原始字符串。怎么做?
回答:
我想这就是你想要的。它不是UTF-8字节字符串(从技术上讲是这样,但这仅是因为ASCII是UTF-8的子集)。
>>> s='\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5'>>> print s.decode('unicode-escape')
欢迎提交微博搜索使用反馈,请直接
仅供参考,这是UTF-8:
>>> s.decode('unicode-escape').encode('utf8')
’\ xe6 \ xac \ xa2 \ xe8 \ xbf \ x8e \ xe6 \ x8f \ x90 \ xe4 \ xba \ xa4 \ xe5
\ xbe \ xae \ xae \ xe5 \ x8d \ x9a \ xe6 \ x90 \ x90 \ x9c \ xe7 \ xb4 \ xa2
\ xe4 \ xbd \ xbf \ xe7 \ x94 \ xa8 \ xe5 \ x8f \ x8d \ xe9 \ xa6 \ x88 \ xef
\ xbc \ x8c \ xe8 \ xaf \ xb7 \ xe7 \ x9b \ xb4 \ xe6 \ x8e \ xa5’
以上是 Python:如何将utf-8代码字符串转换回字符串? 的全部内容, 来源链接: utcz.com/qa/404363.html