用python爬取猫眼票房的数据,为什么会是这样的乱码呢

http://piaofang.maoyan.com/?d... 这是要爬的网站,我要取得今天票房大盘数据,我用下面的代码爬去

import requests

from bs4 import BeautifulSoup

res = requests.get("http://piaofang.maoyan.com/?date=2016-09-07")

res.encoding = "utf-8"

soup = BeautifulSoup(res.text,"lxml")

print(soup)

输出的是[<span id="ticket_count"><i class="cs gsBlur">.万</i></span>]这样的,关键数据怎么是乱码呢

求哪位好人帮忙看下原因,谢谢

回答:

因为网站用了自定义字体来替代数字。。自己把这些字符做个对应表转换吧

clipboard.png

回答:

楼上说的还真没想到,我还以为是js做了加密呢,还有另外一种方法可以获取数据
图片描述

图片描述

这是个ajax请求,通过控制台可以分析的,请求参数中的uid请看页面中,相信题主能找到的,类似的可以得到昨天、明天的数据,等等

以上是 用python爬取猫眼票房的数据,为什么会是这样的乱码呢 的全部内容, 来源链接: utcz.com/a/164984.html

回到顶部