python爬取猫眼票房的数据,遇到美团登录验证怎么办

python爬取猫眼票房的数据,遇到美团登录验证怎么办

python爬取猫眼票房的数据
地址:https://piaofang.maoyan.com/?ver=normal

import requests

from fake_useragent import UserAgent

import base64

from lxml import etree

from requests import RequestException

# fake_useragent使用

ua = UserAgent()

def download_page(url):

headers = {

'User-Agent': ua.random,

'Sec - Fetch - Mode': 'no-cors',

'Referer': 'https://piaofang.maoyan.com/?ver=normal'

}

try:

response = requests.get(url=url, headers=headers)

if response.status_code == 200:

return response.content

else:

print(response.status_code)

return None

except RequestException:

print(RequestException.args)

return None

def get_contents(html):

print(html)

def main():

url = 'https://piaofang.maoyan.com/?ver=normal'

html = download_page(url)

get_contents(html)

if __name__ == '__main__':

main()

使用requests.get(url=url, headers=headers)爬取到的网页是美团登录验证的网页,请问怎样才能继续爬取数据

接触爬虫时间不久,所以很多知识不足,请各位大佬指教,提供具体思路就好

谢谢大家,祝大家生活开心


回答:

既然是刚学不久,那么很简单,去登录一下,然后把 cookie 粘贴到你的 requests 的 header 里,然后你去访问的时候,就相当于是已经登录了,但是这个失效就不一定是多久了。

这种是非常简单的一个绕过措施,很有可能你爬到第 N 页,他们页面还有一个验证码要你输入,那就不是 requests 能够解决的了,这个等你爬虫学的再深入一些,你自己就知道该怎么做了。


回答:

爬虫时,先访问登陆页,用账户密码登录,登陆后携cookie在去request这个页面

以上是 python爬取猫眼票房的数据,遇到美团登录验证怎么办 的全部内容, 来源链接: utcz.com/a/156967.html

回到顶部