python爬虫中lxml如何测试?

python

做编程的一个重要环节,就是学会做测试。不然光写代码也是不行的,毕竟代码需要落实到实处才能产生价值。lxml获取网页的知识我们暂且不讲。喜欢实践的小伙伴一定不要错过今天的内容,测试还是非常有意思的。接下来小编带着大家一起l学习xml在python中的测试吧~


代码:

from lxml import etree

html = etree.parse('hello.html')

print type(html)

result = html.xpath('//li')

print result

print len(result)

print type(result)

print type(result[0])

运行结果

<type 'lxml.etree._ElementTree'>

[<Element li at 0x1014e0e18>, <Element li at 0x1014e0ef0>, <Element li at 0x1014e0f38>, <Element li at 0x1014e0f80>, <Element li at 0x1014e0fc8>]

5

<type 'list'>

<type 'lxml.etree._Element'>

可见,etree.parse 的类型是 ElementTree,通过调用 xpath 以后,得到了一个列表,包含了 5 个

  • 元素,每个元素都是 Element 类型 (2)获取

  • 标签的所有 class

result = html.xpath('//li/@class')

print result

运行结果

['item-0', 'item-1', 'item-inactive', 'item-1', 'item-0']


以上就是python爬虫中lxml测试的一些实例。更多Python学习推荐:云海天Python教程网

以上是 python爬虫中lxml如何测试? 的全部内容, 来源链接: utcz.com/z/529462.html

回到顶部