有效地从Java字符串中删除特定字符(某些标点符号)?
在Java中,从字符串中删除给定字符的最有效方法是什么?目前,我有以下代码:
private static String processWord(String x) { String tmp;
tmp = x.toLowerCase();
tmp = tmp.replace(",", "");
tmp = tmp.replace(".", "");
tmp = tmp.replace(";", "");
tmp = tmp.replace("!", "");
tmp = tmp.replace("?", "");
tmp = tmp.replace("(", "");
tmp = tmp.replace(")", "");
tmp = tmp.replace("{", "");
tmp = tmp.replace("}", "");
tmp = tmp.replace("[", "");
tmp = tmp.replace("]", "");
tmp = tmp.replace("<", "");
tmp = tmp.replace(">", "");
tmp = tmp.replace("%", "");
return tmp;
}
如果我使用某种StringBuilder或正则表达式,或者其他方法,会更快吗?是的,我知道:剖析并查看,但是我希望有人能够提供一个解答,因为这是一项常见的任务。
回答:
这是一个很晚的答案,只是为了好玩。
在这种情况下,我建议您以提高速度的可读性为目标。当然,您可以超级可读,但速度太慢,例如在此超级简洁版本中:
private static String processWord(String x) { return x.replaceAll("[][(){},.;!?<>%]", "");
}
这很慢,因为每次调用此方法时,都会编译正则表达式。因此,您可以预编译正则表达式。
private static final Pattern UNDESIRABLES = Pattern.compile("[][(){},.;!?<>%]");private static String processWord(String x) {
return UNDESIRABLES.matcher(x).replaceAll("");
}
假设JVM的regex引擎优化了字符类查找,这对于大多数用途来说应该足够快。这是我个人使用的解决方案。
现在不进行概要分析,我不知道您是否可以通过创建自己的字符(实际上是代码点)查找表来做得更好:
private static final boolean[] CHARS_TO_KEEP = new boolean[];
填充一次,然后进行迭代,生成最终的字符串。我将代码留给您。:)
同样,我不会深入研究这种优化。代码变得太难阅读了。性能是否值得关注?还要记住,现代语言是JIT的,预热后它们的性能会更好,因此请使用良好的分析器。
应当提到的一件事是,原始问题中的示例表现极差,因为您正在创建一大堆临时字符串!除非编译器进行了所有优化,否则该特定解决方案的性能将最差。
以上是 有效地从Java字符串中删除特定字符(某些标点符号)? 的全部内容, 来源链接: utcz.com/qa/419918.html