我想使用JavaScript从字符串中删除除空格之外的所有特殊字符。

例如, 美国广播公司的测试#年代 应输出为 abc测试。


当前回答

试试这个:

const strippedString = htmlString.replace(/(<([^>]+)>)/gi, "");
console.log(strippedString);

其他回答

你想从字符串中删除谁的特殊字符,准备一个列表,然后使用javascript替换函数删除所有特殊字符。

var str = 'abc'de#;:sfjkewr47239847duifyh';
alert(str.replace("'","").replace("#","").replace(";","").replace(":",""));

或者你可以为整个字符串运行循环,并将单个单个字符与ASCII码进行比较,并重新生成一个新字符串。

你应该使用字符串替换函数,一个单一的正则表达式。 假设你所说的特殊字符是指任何不是字母的字符,下面是一个解决方案:

Const STR = "abc's test#s"; console.log (str。replace(/[^a-zA-Z]/g, "");

第一种解决方案不适用于任何UTF-8字母。(它将剪切诸如Привіт这样的文本)。我已经设法创建了一个不使用RegExp的函数,并在JavaScript引擎中使用了良好的UTF-8支持。原理很简单,如果一个符号的大写和小写相等,它就是一个特殊字符。唯一的例外是空格。

function removeSpecials(str) {
    var lower = str.toLowerCase();
    var upper = str.toUpperCase();

    var res = "";
    for(var i=0; i<lower.length; ++i) {
        if(lower[i] != upper[i] || lower[i].trim() === '')
            res += str[i];
    }
    return res;
}

更新:请注意,此解决方案仅适用于有小写字母和大写字母的语言。在像中文这样的语言中,这行不通。

更新2:当我在进行模糊搜索时,我得到了最初的解决方案。如果您还试图删除特殊字符来实现搜索功能,还有更好的方法。使用任何音译库,它将只从拉丁字符生成字符串,然后简单的Regexp将执行删除特殊字符的所有魔法。(这对中国人也适用,你也会通过制作特罗姆瑟得到额外的好处)。

我尝试了Seagul非常有创意的解决方案,但发现它也将数字视为特殊字符,这并不适合我的需求。以下是我对Seagul解决方案的(故障保险)调整……

//return true if char is a number
function isNumber (text) {
  if(text) {
    var reg = new RegExp('[0-9]+$');
    return reg.test(text);
  }
  return false;
}

function removeSpecial (text) {
  if(text) {
    var lower = text.toLowerCase();
    var upper = text.toUpperCase();
    var result = "";
    for(var i=0; i<lower.length; ++i) {
      if(isNumber(text[i]) || (lower[i] != upper[i]) || (lower[i].trim() === '')) {
        result += text[i];
      }
    }
    return result;
  }
  return '';
}

试着用这个

var result= stringToReplace.replace(/[^\w\s]/g, '')

[^]表示否定,\w表示[a-zA-Z0-9_]字字符,\s表示空格, /[]/g表示全局