xpath中如何获得直接包含在div内部的文本,以及如何获得一个元素的Html
1.请问下大佬问如何获得直接包含在div内部的文本,比如获得<div>tilte</div>中的title文本;
2.什么方法可以获得Element的html
回答:
<body> <div>title</div>
</body>
上述形式的情况下
需要先定位到div元素
data:代表这个html文档根Element
list_ = data.xpath("//div") # 不考虑div所在的位置,获取所有满足div名称的元素,此时会返回一个Element 数组for i in list_:
print(i.text) # text就是title信息
参考:https://www.w3school.com.cn/x...
>>> broken_html = "<html><head><title>test<body><h1>page title</h3>">>> parser = etree.HTMLParser()
>>> tree = etree.parse(StringIO(broken_html), parser)
>>> result = etree.tostring(tree.getroot(),
... pretty_print=True, method="html")
>>> print(result)
<html>
<head>
<title>test</title>
</head>
<body>
<h1>page title</h1>
</body>
</html>
参考:https://lxml.de/parsing.html
Parsing HTML章节
回答:
//div/text() 可以获取内容
以上是 xpath中如何获得直接包含在div内部的文本,以及如何获得一个元素的Html 的全部内容, 来源链接: utcz.com/a/158390.html