python爬虫中lxml如何测试?
做编程的一个重要环节,就是学会做测试。不然光写代码也是不行的,毕竟代码需要落实到实处才能产生价值。lxml获取网页的知识我们暂且不讲。喜欢实践的小伙伴一定不要错过今天的内容,测试还是非常有意思的。接下来小编带着大家一起l学习xml在python中的测试吧~
代码:
from lxml import etreehtml = etree.parse('hello.html')
print type(html)
result = html.xpath('//li')
print result
print len(result)
print type(result)
print type(result[0])
运行结果
<type 'lxml.etree._ElementTree'>[<Element li at 0x1014e0e18>, <Element li at 0x1014e0ef0>, <Element li at 0x1014e0f38>, <Element li at 0x1014e0f80>, <Element li at 0x1014e0fc8>]
5
<type 'list'>
<type 'lxml.etree._Element'>
可见,etree.parse 的类型是 ElementTree,通过调用 xpath 以后,得到了一个列表,包含了 5 个
元素,每个元素都是 Element 类型 (2)获取
标签的所有 class
result = html.xpath('//li/@class')print result
运行结果
['item-0', 'item-1', 'item-inactive', 'item-1', 'item-0']
以上就是python爬虫中lxml测试的一些实例。更多Python学习推荐:云海天Python教程网。
以上是 python爬虫中lxml如何测试? 的全部内容, 来源链接: utcz.com/z/529462.html