使用正则表达式匹配utf-8编码中的任何中文字符
例如,我想匹配组成的字符串m来n中国的字符,然后我可以使用:
[single Chinese character regular expression]{m,n}
是否存在单个汉字的某些正则表达式,可能是存在的任何汉字?
回答:
与中文(好吧,CJK)字符匹配的正则表达式为
\p{script=Han}
可以简化为
\p{Han}
这假定您的正则表达式编译器满足UTS#18 Unicode正则表达式的RL1.2属性要求。Perl和Java 7都符合该规范,但其他许多不符合。
以上是 使用正则表达式匹配utf-8编码中的任何中文字符 的全部内容, 来源链接: utcz.com/qa/405098.html