如何替换Java中不可打印的Unicode字符?
以下内容将替换ASCII控制字符(的缩写[\x00-\x1F\x7F]
):
my_string.replaceAll("\\p{Cntrl}", "?");
以下内容将替换所有ASCII不可打印字符(的缩写[\p{Graph}\x20]
),包括带重音符号的字符:
my_string.replaceAll("[^\\p{Print}]", "?");
但是,两者均不适用于Unicode字符串。有谁能从Unicode字符串中删除不可打印字符的好方法?
回答:
my_string.replaceAll("\\p{C}", "?");
详细了解Unicode正则表达式。java.util.regexPattern/ String.replaceAll
支持他们。
以上是 如何替换Java中不可打印的Unicode字符? 的全部内容, 来源链接: utcz.com/qa/403045.html