关于requests库无法获取网页的问题？

Z时代
2024-02-08
分类：IT

想获取一个物流公司的特定单号的物流信息。
通过requests库" title="requests库">requests库获取的信息与右键查询的网页代码差别非常大

import reuqests
url='http://qqb3c.cn/webapp/orderDetail.html?orderNumber=D89F3A35931C386956C1A402A8E09941@11339833&openid='
header={
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36 Edg/114.0.1823.58'
}
r=requests.get(url,headers=header)r=r.content.decode('utf-8')

11339833是订单号码
初学者，想了解为什么会出现这个情况

回答：

我看了下你的代码中url部分
关于requests库无法获取网页的问题？

从这个网页的 HTML 代码来看，它包含了一些 JavaScript 的引用，这些 JavaScript 文件中可能包含动态生成网页的代码。
因此使用模拟行为模拟用户打开浏览器网页的过程，就可以成功获取到网页中动态加载的物流信息。

import time
from selenium import webdriver
# 创建浏览器实例
driver = webdriver.Chrome()
# 打开页面
url = "http://qqb3c.cn/webapp/orderDetail.html?orderNumber=D89F3A35931C386956C1A402A8E09941@11339833&openid="
driver.get(url)
# 等待页面加载完成
time.sleep(5)
# 获取物流信息
logistics_info = driver.find_element_by_id('logisticsInfo').text
# 打印物流信息
print(logistics_info)
# 关闭浏览器driver.quit()

以上是关于requests库无法获取网页的问题？的全部内容，来源链接： utcz.com/p/938921.html

关于requests库无法获取网页的问题？

回答：

其他人也看了：