如何使用正则表达式来提取带有html内容的数据?
我有以下的HTML内容,我想只使用正则表达式提取Id像31673 31672 3166 316。如何使用正则表达式来提取带有html内容的数据?
<a href="/CaseMgrTesting/Pat/Summary/31673">31673</a> <a href="/CaseMgrTesting/Pat/Summary/31672">31672</a>
<a href="/CaseMgrTesting/Pat/Summary/3166">3166</a>
<a href="/CaseMgrTesting/Pat/Summary/316">316</a>
创建的正则表达式像下面,遗憾的是它只能返回31673 31672.我也想删除像HREF硬代码=“/ CaseMgrTesting/PAT /概述/和\ d \ d \ d \ d \ d,任何人都可以给我正确的正则表达式将是马丽娟升值。
(?<=<a\shref="/CaseMgrTesting/Pat/Summary/\d\d\d\d\d">).*(?=</a>)
回答:
您的一站式答案是 Html Agility Pack。这个漂亮的必须具备的,您可以通过节点接近HTML,了解它。好好生活,因为喜欢它。
回答:
<a .*?>(.*)</a>
对此问题使用此正则表达式。其简单的一个尝试。
回答:
使用此(正则表达式的更新答案):
<a .*?>(.*?)</a>
这样做的重要的一块是*
后?
。这将使.*
(全部匹配)非贪婪,否则你最多只能有一场比赛。
以上是 如何使用正则表达式来提取带有html内容的数据? 的全部内容, 来源链接: utcz.com/qa/261056.html