如何使用正则表达式来提取带有html内容的数据?

我有以下的HTML内容,我想只使用正则表达式提取Id像31673 31672 3166 316。如何使用正则表达式来提取带有html内容的数据?

<a href="/CaseMgrTesting/Pat/Summary/31673">31673</a> 

<a href="/CaseMgrTesting/Pat/Summary/31672">31672</a>

<a href="/CaseMgrTesting/Pat/Summary/3166">3166</a>

<a href="/CaseMgrTesting/Pat/Summary/316">316</a>

创建的正则表达式像下面,遗憾的是它只能返回31673 31672.我也想删除像HREF硬代码=“/ CaseMgrTesting/PAT /概述/和\ d \ d \ d \ d \ d,任何人都可以给我正确的正则表达式将是马丽娟升值。

(?<=<a\shref="/CaseMgrTesting/Pat/Summary/\d\d\d\d\d">).*(?=</a>) 

回答:

您的一站式答案是 Html Agility Pack。这个漂亮的必须具备的,您可以通过节点接近HTML,了解它。好好生活,因为喜欢它。

回答:

<a .*?>(.*)</a> 

对此问题使用此正则表达式。其简单的一个尝试。

回答:

使用此(正则表达式的更新答案):

<a .*?>(.*?)</a> 

这样做的重要的一块是*?。这将使.*(全部匹配)非贪婪,否则你最多只能有一场比赛。

以上是 如何使用正则表达式来提取带有html内容的数据? 的全部内容, 来源链接: utcz.com/qa/261056.html

回到顶部