用python爬取猫眼票房的数据,为什么会是这样的乱码呢
http://piaofang.maoyan.com/?d... 这是要爬的网站,我要取得今天票房大盘数据,我用下面的代码爬去
import requestsfrom bs4 import BeautifulSoup
res = requests.get("http://piaofang.maoyan.com/?date=2016-09-07")
res.encoding = "utf-8"
soup = BeautifulSoup(res.text,"lxml")
print(soup)
输出的是[<span id="ticket_count"><i class="cs gsBlur">.万</i></span>]
这样的,关键数据怎么是乱码呢
求哪位好人帮忙看下原因,谢谢
回答:
因为网站用了自定义字体来替代数字。。自己把这些字符做个对应表转换吧
回答:
楼上说的还真没想到,我还以为是js做了加密呢,还有另外一种方法可以获取数据
这是个ajax请求,通过控制台可以分析的,请求参数中的uid请看页面中,相信题主能找到的,类似的可以得到昨天、明天的数据,等等
以上是 用python爬取猫眼票房的数据,为什么会是这样的乱码呢 的全部内容, 来源链接: utcz.com/a/164984.html