解析bbcode的最佳方法

我想为php网站使用bbcode过滤器。(我正在使用cakephp,它将是一个bbcode助手)我有一些要求。

[block]  

[block]

[/block]

[block]

[block]

[/block]

[/block]

[/block]

范例:

[video: url="url", width="500", height="500"]Title[/video]

可以说,[url]text[/url]将转换为[url:url="text"]text[/url]

或视频bbcode可以在youtube,dailymotion …之间进行选择。

我认为它可以满足我的大部分需求。我用正则表达式做了一些事情。但是我最大的问题是匹配参数。实际上,我可以使用嵌套的bbcode并使用0参数的bbcode。但是,当我添加参数的正则表达式匹配时,它与嵌套的bbcode匹配不正确。

"\[($tag)(=.*)\"\](.*)\[\/\1\]" //不是。*,但非匹配器

我现在没有完整的正则表达式,但是我有一个看起来像(上面)的东西。

因此,有一种方法可以将bbcode与正则表达式或其他有效匹配。我唯一能想到的就是使用访客模式,并以这种方式将文本与每个可能的标签分开,我可以对文本解析有更多的控制权,而且我可能会验证我的文档,因此如果输入文本没有没有有效的bbcode。我可以在保存任何内容之前通知用户错误。

我将使用sablecc创建我的文本解析器。 http://sablecc.org/

有更好的主意吗?或任何可能导致高效灵活的bbcode解析器的东西?

谢谢,抱歉我的英语不好。

回答:

同时有一个pecl和PEAR

BBCode解析库。软件足够强大,而不必自己重复数年的工作。

如果这两个选项都不可行,那么我将集中精力将BBCode转换为有效的XML字符串,然后对它使用您喜欢的XML解析例程。这里的想法非常非常粗糙,但是

  1. 通过htmlspecialchars运行代码以转义任何需要转义的实体

  2. 将所有[和]字符分别转换为<和>

  3. 在[标记名:

如果BBCode正确嵌套,则应该全部设置为将此字符串传递到XML解析对象(SimpleXML,DOMDocument等)中。

以上是 解析bbcode的最佳方法 的全部内容, 来源链接: utcz.com/qa/431872.html

回到顶部