Python-提取正则表达式匹配项的一部分

我想要一个正则表达式从HTML页面提取标题。目前我有这个:

title = re.search('<title>.*</title>', html, re.IGNORECASE).group()

if title:

title = title.replace('<title>', '').replace('</title>', '')

是否有一个正则表达式仅提取<title>的内容,所以我不必删除标签?

回答:

( )在正则表达式和group(1)python中检索捕获的字符串(re.search将返回None如果没有找到结果,所以不要用group()直接):

title_search = re.search('<title>(.*)</title>', html, re.IGNORECASE)

if title_search:

title = title_search.group(1)

以上是 Python-提取正则表达式匹配项的一部分 的全部内容, 来源链接: utcz.com/qa/431807.html

回到顶部