.net正则表达式:字符\ w是什么?
一个简单的问题:c#、. net中
的单词字符的模式是什么\w
?
我首先想到的是它匹配[A-Za-z0-9_]
并且文档告诉我:
**字符类别描述模式匹配**\ w匹配任何\ w“ I”,“ D”,“ A”,“ 1”,“ 3”
文字字符。在“ ID A1.3”中
这不是很有帮助。
并且\w
似乎也匹配äöü
。还有什么?有更好的(精确)定义吗?
回答:
从文档中:
文字字元:\ w
\w
匹配任何单词字符。单词字符是下表列出的任何Unicode类别的成员。
Ll
(小写字母)Lu
(大写字母)Lt
(字母,标题)Lo
(其他)Lm
(字母,修饰符)Nd
(数字,十进制数字)Pc
(标点,连接器)
- 此类别包括十个字符,其中最常用的是LOWLINE字符(_),即u + 005F。
如果指定了ECMAScript兼容行为,
\w
则等效于[a-zA-Z_0-9]
。
也可以看看
- Unicode字符数据库
- 标点,连接器类别中的Unicode字符
以上是 .net正则表达式:字符\ w是什么? 的全部内容, 来源链接: utcz.com/qa/413424.html