Python爬取去哪了旅游景点数据
前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理
本次目标
爬取去哪了湖南旅游景点信息
https://piao.qunar.com/ticket/list.htm?from=mpshouye_hotdest_more&keyword=%E6%B9%96%E5%8D%97&page=1
环境
- Python3.6
- pycharm
爬虫代码
导入工具
import requestsimport parsel
import csv
import time
请求网站
url = "https://piao.qunar.com/ticket/list_%E5%BC%A0%E5%AE%B6%E7%95%8C.html?from=mps_search_suggest_c&keyword=%E5%BC%A0%E5%AE%B6%E7%95%8C&page={}".format(page)headers = {
"user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36"
}
response = requests.get(url=url, headers=headers)
解析网站数据
for page in range(1, 11): time.sleep(1)
for li in lis:
title = li.css(".sight_item_caption a::attr(title)").get() # 景区名字
dit["景区名字"] = title
level = li.css(".sight_item_info .level::text").get() # 景区等级
dit["景区等级"] = level
area = li.css(".area a::attr(title)").get() # 地区
dit["地区"] = area
address = li.css(".address span::attr(title)").get() # 地址
dit["地址"] = address
string = li.css(".product_star_level em::attr(title)").get() # 热度
star_level = float(string.strip("热度: "))
dit["热度"] = star_level
intro = li.css(".intro::attr(title)").get() # 简介
dit["简介"] = intro
price = li.css(".sight_item_price em::text").get() # 价格
dit["价格"] = price
hot_num = li.css(".hot_num::text").get() # 月销
dit["月销"] = hot_num
csv_writer.writerow(dit)
保存数据
f = open("旅游景点.csv", mode="a", encoding="utf-8-sig", newline="")csv_writer = csv.DictWriter(f, fieldnames=["景区名字", "景区等级", "地区", "地址", "热度", "简介", "价格", "月销"])
csv_writer.writeheader()
print(dit)
运行代码,效果如下图
以上是 Python爬取去哪了旅游景点数据 的全部内容, 来源链接: utcz.com/z/530171.html