Python-提取正则表达式匹配项的一部分
我想要一个正则表达式从HTML页面提取标题。目前我有这个:
title = re.search('<title>.*</title>', html, re.IGNORECASE).group()if title:
title = title.replace('<title>', '').replace('</title>', '')
是否有一个正则表达式仅提取<title>
的内容,所以我不必删除标签?
回答:
用( )
在正则表达式和group(1)python
中检索捕获的字符串(re.search
将返回None
如果没有找到结果,所以不要用group()
直接):
title_search = re.search('<title>(.*)</title>', html, re.IGNORECASE)if title_search:
title = title_search.group(1)
以上是 Python-提取正则表达式匹配项的一部分 的全部内容, 来源链接: utcz.com/qa/431807.html