.net正则表达式:字符\ w是什么?

一个简单的问题:c#、. net中

的单词字符的模式是什么\w

我首先想到的是它匹配[A-Za-z0-9_]并且文档告诉我:

**字符类别描述模式匹配**

\ w匹配任何\ w“ I”,“ D”,“ A”,“ 1”,“ 3”

文字字符。在“ ID A1.3”中

这不是很有帮助。

并且\w似乎也匹配äöü。还有什么?有更好的(精确)定义吗?

回答:

从文档中:

文字字元:\ w

\w匹配任何单词字符。单词字符是下表列出的任何Unicode类别的成员。

  • Ll (小写字母)
  • Lu (大写字母)
  • Lt (字母,标题)
  • Lo (其他)
  • Lm (字母,修饰符)
  • Nd (数字,十进制数字)
  • Pc (标点,连接器)

    • 此类别包括十个字符,其中最常用的是LOWLINE字符(_),即u + 005F。

如果指定了ECMAScript兼容行为,\w则等效于[a-zA-Z_0-9]

也可以看看

  • Unicode字符数据库
  • 标点,连接器类别中的Unicode字符

以上是 .net正则表达式:字符\ w是什么? 的全部内容, 来源链接: utcz.com/qa/413424.html

回到顶部