python 爬虫的xpath 问题

python 爬虫的xpath 问题

我用xpath 这样写

leftData=htmlResult.xpath('//td[contains(@align,"left")]/text()')

最后的结果是这样 :

['\r\n\t\t\t\t\t\t\t  21060\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t    \r\n\t\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t\t\r\n\t\t\t\t\t\t\t  \r\n\t\t\t\t\t\t\t  \t\t\t', '\r\n\t\t\t\t\t\t\t  乙烯基乙炔\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  Vinyl acetylene;Buten-3-yne\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  \t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  \r\n          C', 'H', ';CH', '\r\n\t\t\t\t\t\t\t  52.04\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  -118℃  沸点:5℃\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  相对密度(水=1)0.71;\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  \r\n\t\t\t\t\t  ', '\r\n\t\t\t\t\t\t\t  \t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  稳定\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  气态(常温)\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  4(易燃气体)\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  在工业上是很需要的烯炔烃化合物,用于制备合成橡胶的单体2-氯丁二燃-[1,3]等\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t  ']

根本没有这个"<-5℃" 这个数据集,求人指教,谢谢!

我觉得我写的没有问题,但是这个数据没有匹配到,不知道为啥!

网址 :https://china.guidechem.com/datacenter/msds/c/733.html


回答:

/html/body/div[2]/div[4]/div[2]/table/tbody/tr/td[3]/table/tbody/tr[10]/td[2]


回答:

你应该查看xpath解析器版本,早期版本类似大小于号这种可能被xpath解析引擎当作html标签容错给忽略掉,从而导致你按照正常的xpath搜索有可能查找不到,请翻阅对应版本的官方指引,一般作特殊处理。

以上是 python 爬虫的xpath 问题 的全部内容, 来源链接: utcz.com/p/937712.html

回到顶部