【搜索技术】Requests抓下来的数据有奇怪的编码问题
代码如图,爬的是bilibili的搜索页面,但是print出来的数据全是这种乱码,已知这个网页的确是用的utf-8
import requestsword = input('>')
payload = {'keyword':word}
r = requests.get('http://search.bilibili.com/all', params=payload)
print(r.text.encode('utf-8'))
回答
r = requests.get(url, proxies=proxies)
r.encoding = r.apparent_encoding
print r.text
这是一个比较简易的, 适配绝大多数编码的方式
以上是 【搜索技术】Requests抓下来的数据有奇怪的编码问题 的全部内容, 来源链接: utcz.com/a/85060.html