如何从字符串中删除除破折号和空格字符外的所有非字母数字字符?


当前回答

这是一个非正则表达式堆分配友好的快速解决方案,这是我正在寻找的。

不安全的版本。

public static unsafe void ToAlphaNumeric(ref string input)
{
    fixed (char* p = input)
    {
        int offset = 0;
        for (int i = 0; i < input.Length; i++)
        {
            if (char.IsLetterOrDigit(p[i]))
            {
                p[offset] = input[i];
                offset++;
            }
        }
        ((int*)p)[-1] = offset; // Changes the length of the string
        p[offset] = '\0';
    }
}

对于那些不想使用不安全或不相信字符串长度的黑客。

public static string ToAlphaNumeric(string input)
{
    int j = 0;
    char[] newCharArr = new char[input.Length];

    for (int i = 0; i < input.Length; i++)
    {
        if (char.IsLetterOrDigit(input[i]))
        {
            newCharArr[j] = input[i];
            j++;
        }
    }

    Array.Resize(ref newCharArr, j);

    return new string(newCharArr);
}

其他回答

将[^a-zA-Z0-9 -]替换为空字符串。

Regex rgx = new Regex("[^a-zA-Z0-9 -]");
str = rgx.Replace(str, "");

我做了一个不同的解决方案,通过消除控制字符,这是我最初的问题。

这比列出所有“特别但不错”的字符要好得多

char[] arr = str.Where(c => !char.IsControl(c)).ToArray();    
str = new string(arr);

它更简单,所以我认为它更好!

使用Regex有一个更简单的方法。

private string FixString(string str)
{
    return string.IsNullOrEmpty(str) ? str : Regex.Replace(str, "[\\D]", "");
}

使用系统。Linq

string withOutSpecialCharacters = new string(stringWithSpecialCharacters.Where(c =>char.IsLetterOrDigit(c) || char.IsWhiteSpace(c) || c == '-').ToArray());

这里我用了其中一个答案的变体。我想用“-”替换空格,这样它的SEO友好,也使小写。也不是参考系统。Web从我的服务层。

private string MakeUrlString(string input)
{
    var array = input.ToCharArray();

    array = Array.FindAll<char>(array, c => char.IsLetterOrDigit(c) || char.IsWhiteSpace(c) || c == '-');

    var newString = new string(array).Replace(" ", "-").ToLower();
    return newString;
}