使用正则表达式匹配utf-8编码中的任何中文字符

例如,我想匹配组成的字符串m来n中国的字符,然后我可以使用:

[single Chinese character regular expression]{m,n}

是否存在单个汉字的某些正则表达式,可能是存在的任何汉字?

回答:

与中文(好吧,CJK)字符匹配的正则表达式为

\p{script=Han}

可以简化为

\p{Han}

这假定您的正则表达式编译器满足UTS#18 Unicode正则表达式的RL1.2属性要求。Perl和Java 7都符合该规范,但其他许多不符合。

以上是 使用正则表达式匹配utf-8编码中的任何中文字符 的全部内容, 来源链接: utcz.com/qa/405098.html

回到顶部