从html标记中删除所有属性

我有这个HTML代码:

<p style="padding:0px;">

<span style="padding:0;margin:0;">hello</span>

</p>

但它应该变成(对于所有可能的html标签" title="html标签">html标签):

<p>

<span>hello</span>

</p>

回答:

改编自我对类似问题的回答

$text = '<p style="padding:0px;"><span style="padding:0;margin:0;">hello</span></p>';

echo preg_replace("/<([a-z][a-z0-9]*)[^>]*?(\/?)>/si",'<$1$2>', $text);

// <p><span>hello</span></p>

RegExp细分:

/              # Start Pattern

< # Match '<' at beginning of tags

( # Start Capture Group $1 - Tag Name

[a-z] # Match 'a' through 'z'

[a-z0-9]* # Match 'a' through 'z' or '0' through '9' zero or more times

) # End Capture Group

[^>]*? # Match anything other than '>', Zero or More times, not-greedy (wont eat the /)

(\/?) # Capture Group $2 - '/' if it is there

> # Match '>'

/is # End Pattern - Case Insensitive & Multi-line ability

添加一些引号,并使用替换文本,<$1$2>它应该删除标记名之后的所有文本,直到标记结尾/>或just 为止>

这不一定适用于 所有 输入,因为Anti-HTML + RegExp会告诉您。有一些后备功能,最明显的是<p

style=">"><p>">失败,还有其他一些坏的问题…我建议将Zend_Filter_StripTags视为PHP中更全面的标签/属性过滤器

以上是 从html标记中删除所有属性 的全部内容, 来源链接: utcz.com/qa/402540.html

回到顶部