在JavaScript中删除字符串中的重音符号/变音符号

如何从字符串中删除重音符号?尤其是在IE6中,我有类似以下内容:

accentsTidy = function(s){

var r=s.toLowerCase();

r = r.replace(new RegExp(/\s/g),"");

r = r.replace(new RegExp(/[àáâãäå]/g),"a");

r = r.replace(new RegExp(/æ/g),"ae");

r = r.replace(new RegExp(/ç/g),"c");

r = r.replace(new RegExp(/[èéêë]/g),"e");

r = r.replace(new RegExp(/[ìíîï]/g),"i");

r = r.replace(new RegExp(/ñ/g),"n");

r = r.replace(new RegExp(/[òóôõö]/g),"o");

r = r.replace(new RegExp(/œ/g),"oe");

r = r.replace(new RegExp(/[ùúûü]/g),"u");

r = r.replace(new RegExp(/[ýÿ]/g),"y");

r = r.replace(new RegExp(/\W/g),"");

return r;

};

但是IE6困扰着我,似乎不喜欢我的正则表达式。

回答:

使用ES2015 / ES6 String.Prototype.Normalize(),

const str = "Crème Brulée"

str.normalize("NFD").replace(/[\u0300-\u036f]/g, "")

> "Creme Brulee"

这里发生两件事:

  1. normalize()根据NFDUnicode规范形式,将组合的字形分解为简单的字形。在èCrème端起来表示为e+ ̀
  2. 现在,使用正则表达式字符类来匹配U + 0300→U + 036F范围,在全局范围内消除变音符号变得微不足道了,Unicode标准将这些变音符号方便地归为组合变音符号 Unicode块。

请参阅评论以进行性能测试。

Intl.Collat​​or现在有足够的支持〜85 %,这里也可以使用polyfill,但我尚未对其进行测试。

const c = new Intl.Collator();

["creme brulee", "crème brulée", "crame brulai", "crome brouillé",

"creme brulay", "creme brulfé", "creme bruléa"].sort(c.compare)

["crame brulai", "creme brulay", "creme bruléa", "creme brulee",

"crème brulée", "creme brulfé", "crome brouillé"]

["creme brulee", "crème brulée", "crame brulai", "crome brouillé"].sort((a,b) => a>b)

["crame brulai", "creme brulee", "crome brouillé", "crème brulée"]

以上是 在JavaScript中删除字符串中的重音符号/变音符号 的全部内容, 来源链接: utcz.com/qa/406888.html

回到顶部