xpath解析出问题

爬取豆瓣的电影,讲每个电影的<li>标签解析到list中,但是在之后对这个list进行遍历时发现list中每个元素都是相同的

movies = selector.xpath('//*[@id="content"]/div/div[1]/ol/li') #讲html解析为多个li标签

for movie in movies:

print(movie.xpath('//span[@class="title"][1]/text()'))#根据每个li标签解析出该电影的信息

爬取的豆瓣页面

结果

回答:

//span前加个.

回答:

import requests

from pyquery import PyQuery as Q

r = requests.get('https://movie.douban.com/')

for _ in Q(r.text).find('.ui-slide-item'):

print Q(_).find('.title').text()

回答:

你爬的网址可以给下吗?没找到你爬的这个页面

回答:

用selenium写的,但是xpath一样,楼主可以改改试试

driver = webdriver.PhantomJS()

driver.get("https://movie.douban.com/top250")

print driver.find_elements_by_xpath('//tbody/tr/td[2]/div/p')

moves = driver.find_elements_by_xpath(".//*[@id='content']/div/div[1]/ol/li/div/div[2]/div[2]/p")

for move in moves:

print move.text

以上是 xpath解析出问题 的全部内容, 来源链接: utcz.com/a/160231.html

回到顶部