python 爬虫的xpath 问题
我用xpath 这样写
leftData=htmlResult.xpath('//td[contains(@align,"left")]/text()')
最后的结果是这样 :
['\r\n\t\t\t\t\t\t\t 21060\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t \r\n\t\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t\t\r\n\t\t\t\t\t\t\t \r\n\t\t\t\t\t\t\t \t\t\t', '\r\n\t\t\t\t\t\t\t 乙烯基乙炔\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t Vinyl acetylene;Buten-3-yne\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t \t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t \r\n C', 'H', ';CH', '\r\n\t\t\t\t\t\t\t 52.04\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t -118℃ 沸点:5℃\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t 相对密度(水=1)0.71;\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t \r\n\t\t\t\t\t ', '\r\n\t\t\t\t\t\t\t \t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t 稳定\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t 气态(常温)\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t 4(易燃气体)\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t 在工业上是很需要的烯炔烃化合物,用于制备合成橡胶的单体2-氯丁二燃-[1,3]等\t\t\t\t\t\t\t', '\r\n\t\t\t\t\t\t\t ']
根本没有这个"<-5℃" 这个数据集,求人指教,谢谢!
我觉得我写的没有问题,但是这个数据没有匹配到,不知道为啥!
网址 :https://china.guidechem.com/datacenter/msds/c/733.html
回答:
/html/body/div[2]/div[4]/div[2]/table/tbody/tr/td[3]/table/tbody/tr[10]/td[2]
回答:
你应该查看xpath解析器版本,早期版本类似大小于号这种可能被xpath解析引擎当作html标签容错给忽略掉,从而导致你按照正常的xpath搜索有可能查找不到,请翻阅对应版本的官方指引,一般作特殊处理。
以上是 python 爬虫的xpath 问题 的全部内容, 来源链接: utcz.com/p/937712.html