关于python2编码问题
我在使用python2来爬虫的时候,获取到中文的编码形式是\x2569\x2514\x255c\x447\x251c\x221a\x2502\x2561\x2567\x2561\x2534\x2568\x31类似这样的,但是就我所知\x在python2里应该是表示utf-8,形式应该是类似\xE5\x85\x84\xE5\xBC\x9F\xE9\x9A\xBE\xE5\xBD\x93 \xE6\x9D\x9C\xE6\xAD\x8C这样的,所以我想知道我第一句的这个是使用的什么编码,感谢大家
回答:
仔细看,或者用pycharm看,或者用python2解释器打印出来就明白了。
\x2569\x2514\x255c\x447\x251c\x221a\x2502\x2561\x2567\x2561\x2534\x2568\x31
%69%14%5cD7%1c"1a%02%61%67%61%34%681
只有前面两个十六进制数字是真的转义字符,后面的的确就是两个普通数字而已。
\x25 就是 %
另外 \x00 这样的并不是utf-8编码或是别的什么特定的编码,单纯只是一种转义字符,\x00-\xff代表0-255的byte。编码需要指定或者猜测。
以上是 关于python2编码问题 的全部内容, 来源链接: utcz.com/p/938060.html