【搜索技术】Requests抓下来的数据有奇怪的编码问题

【搜索技术】Requests抓下来的数据有奇怪的编码问题

代码如图,爬的是bilibili的搜索页面,但是print出来的数据全是这种乱码,已知这个网页的确是用的utf-8

import requests

word = input('>')

payload = {'keyword':word}

r = requests.get('http://search.bilibili.com/all', params=payload)

print(r.text.encode('utf-8'))

回答

r = requests.get(url, proxies=proxies)
r.encoding = r.apparent_encoding
print r.text

这是一个比较简易的, 适配绝大多数编码的方式

以上是 【搜索技术】Requests抓下来的数据有奇怪的编码问题 的全部内容, 来源链接: utcz.com/a/85060.html

回到顶部