Python 爬虫实例(8)—— 爬取 动态页面

python

今天使用python 和selenium爬取动态数据,主要是通过不停的更新页面,实现数据的爬取,要爬取的数据如下图

源代码:

#-*-coding:utf-8-*-

import time

from selenium import webdriver

import os

import re

#引入chromedriver.exe

chromedriver = "C:/Users/xuchunlin/AppData/Local/Google/Chrome/Application/chromedriver.exe"

os.environ["webdriver.chrome.driver"] = chromedriver

browser = webdriver.Chrome(chromedriver)

#设置浏览器需要打开的url

url = "https://www.jin10.com/"

# 使用for循环不停的刷新页面,也可以每隔一段时间刷新页面

for i in range(1,100000):

browser.get(url)

result= browser.page_source

gold_price = ""

gold_price_change = ""

try:

gold_price = re.findall('<div >,result)[0]

gold_price_change = re.findall('<div >,result)[0]

except:

gold_pric = "------"

gold_price_change = "------"

print gold_price

print gold_price_change

time.sleep(1)

以上是 Python 爬虫实例(8)—— 爬取 动态页面 的全部内容, 来源链接: utcz.com/z/388998.html

回到顶部