使用Selenium Webdriver(Python)循环链接
下午全部。当前尝试使用Selenium
Webdriver循环浏览页面上的链接列表。具体来说,它是单击链接,从所述页面上抓取一行文本以写入文件,然后返回,然后单击列表中的下一个链接。以下是我所拥有的:
def test_text_saver(self): driver = self.driver
textsave = open("textsave.txt","w")
list_of_links = driver.find_elements_by_xpath("//*[@id=\"learn-sub\"]/div[4]/div/div/div/div[1]/div[2]/div/div/ul/li")
"""Initializing Link Count:"""
link_count = len(list_of_links)
while x <= link_count:
print x
driver.find_element_by_xpath("//*[@id=\"learn-sub\"]/div[4]/div/div/div/div[1]/div[2]/div/div/ul/li["+str(x)+"]/a").click()
text = driver.find_element_by_xpath("//*[@id=\"learn-sub\"]/div[4]/div/div/div/div[1]/div[1]/div[1]/h1").text
textsave.write(text+"\n\n")
driver.implicitly_wait(5000)
driver.back()
x += 1
textsave.close()
运行时,它会转到初始页面,然后返回主页面,而不是应有的子页面。打印x,我可以看到它递增了三倍而不是一倍。此后它也崩溃。我已经检查了所有的xpath等,并确认列表中的链接数得到了正确的计数。
非常感谢任何输入-这实际上只是为了扩展我的python / automation,因为我只是同时进入两者。提前致谢!!
回答:
我不确定这是否可以解决问题,但总的来说,最好使用WebDriverWait
而不是使用WebDriveWait.until,implicitly_wait
因为它会一直调用提供的函数(例如),直到返回的值不是-
ish或超时(例如5000秒) )达到了-
在那个时候它提出一个。driver.find_element_by_xpath``False``selenium.common.execptions.TimeoutException
import selenium.webdriver.support.ui as UIdef test_text_saver(self):
driver = self.driver
wait = UI.WebDriverWait(driver, 5000)
with open("textsave.txt","w") as textsave:
list_of_links = driver.find_elements_by_xpath("//*[@id=\"learn-sub\"]/div[4]/div/div/div/div[1]/div[2]/div/div/ul/li/a")
for link in list_of_links: # 2
link.click() # 1
text = wait.until(
lambda driver: driver.find_element_by_xpath("//*[@id=\"learn-sub\"]/div[4]/div/div/div/div[1]/div[1]/div[1]/h1").text)
textsave.write(text+"\n\n")
driver.back()
- 单击链接后,应等待加载链接的URL。因此,
wait.until
直接在link.click()
- 而不是使用
while x <= link_count:
...
x += 1
最好用
for link in list_of_links:
有人认为,它提高了可读性。而且,您真的不需要关心数字x
,您真正关心的只是循环链接,这就是它的for-loop
作用。
以上是 使用Selenium Webdriver(Python)循环链接 的全部内容, 来源链接: utcz.com/qa/416709.html