有效地从Java字符串中删除特定字符(某些标点符号)?

在Java中,从字符串中删除给定字符的最有效方法是什么?目前,我有以下代码:

private static String processWord(String x) {

String tmp;

tmp = x.toLowerCase();

tmp = tmp.replace(",", "");

tmp = tmp.replace(".", "");

tmp = tmp.replace(";", "");

tmp = tmp.replace("!", "");

tmp = tmp.replace("?", "");

tmp = tmp.replace("(", "");

tmp = tmp.replace(")", "");

tmp = tmp.replace("{", "");

tmp = tmp.replace("}", "");

tmp = tmp.replace("[", "");

tmp = tmp.replace("]", "");

tmp = tmp.replace("<", "");

tmp = tmp.replace(">", "");

tmp = tmp.replace("%", "");

return tmp;

}

如果我使用某种StringBuilder或正则表达式,或者其他方法,会更快吗?是的,我知道:剖析并查看,但是我希望有人能够提供一个解答,因为这是一项常见的任务。

回答:

这是一个很晚的答案,只是为了好玩。

在这种情况下,我建议您以提高速度的可读性为目标。当然,您可以超级可读,但速度太慢,例如在此超级简洁版本中:

private static String processWord(String x) {

return x.replaceAll("[][(){},.;!?<>%]", "");

}

这很慢,因为每次调用此方法时,都会编译正则表达式。因此,您可以预编译正则表达式。

private static final Pattern UNDESIRABLES = Pattern.compile("[][(){},.;!?<>%]");

private static String processWord(String x) {

return UNDESIRABLES.matcher(x).replaceAll("");

}

假设JVM的regex引擎优化了字符类查找,这对于大多数用途来说应该足够快。这是我个人使用的解决方案。

现在不进行概要分析,我不知道您是否可以通过创建自己的字符(实际上是代码点)查找表来做得更好:

private static final boolean[] CHARS_TO_KEEP = new boolean[];

填充一次,然后进行迭代,生成最终的字符串。我将代码留给您。:)

同样,我不会深入研究这种优化。代码变得太难阅读了。性能是否值得关注?还要记住,现代语言是JIT的,预热后它们的性能会更好,因此请使用良好的分析器。

应当提到的一件事是,原始问题中的示例表现极差,因为您正在创建一大堆临时字符串!除非编译器进行了所有优化,否则该特定解决方案的性能将最差。

以上是 有效地从Java字符串中删除特定字符(某些标点符号)? 的全部内容, 来源链接: utcz.com/qa/419918.html

回到顶部