如何从字符串中删除除破折号和空格字符外的所有非字母数字字符?


当前回答

我做了一个不同的解决方案,通过消除控制字符,这是我最初的问题。

这比列出所有“特别但不错”的字符要好得多

char[] arr = str.Where(c => !char.IsControl(c)).ToArray();    
str = new string(arr);

它更简单,所以我认为它更好!

其他回答

这里我用了其中一个答案的变体。我想用“-”替换空格,这样它的SEO友好,也使小写。也不是参考系统。Web从我的服务层。

private string MakeUrlString(string input)
{
    var array = input.ToCharArray();

    array = Array.FindAll<char>(array, c => char.IsLetterOrDigit(c) || char.IsWhiteSpace(c) || c == '-');

    var newString = new string(array).Replace(" ", "-").ToLower();
    return newString;
}

将[^a-zA-Z0-9 -]替换为空字符串。

Regex rgx = new Regex("[^a-zA-Z0-9 -]");
str = rgx.Replace(str, "");

如果你用JS工作,这里有一个非常简洁的版本

myString = myString.replace(/[^A-Za-z0-9 -]/g, "");

正则表达式为[^\w\s\-]*:

使用\s而不是space()更好,因为文本中可能有制表符。

想要速食吗?

public static class StringExtensions 
{
    public static string ToAlphaNumeric(this string self,
                                        params char[] allowedCharacters)
    {
        return new string(Array.FindAll(self.ToCharArray(),
                                        c => char.IsLetterOrDigit(c) ||
                                        allowedCharacters.Contains(c)));
    }
}

这将允许您指定您希望允许的字符。