如何从字符串中删除除破折号和空格字符外的所有非字母数字字符?


当前回答

你可以试试:

string s1 = Regex.Replace(s, "[^A-Za-z0-9 -]", "");

s是你的弦。

其他回答

将[^a-zA-Z0-9 -]替换为空字符串。

Regex rgx = new Regex("[^a-zA-Z0-9 -]");
str = rgx.Replace(str, "");

这是一个非正则表达式堆分配友好的快速解决方案,这是我正在寻找的。

不安全的版本。

public static unsafe void ToAlphaNumeric(ref string input)
{
    fixed (char* p = input)
    {
        int offset = 0;
        for (int i = 0; i < input.Length; i++)
        {
            if (char.IsLetterOrDigit(p[i]))
            {
                p[offset] = input[i];
                offset++;
            }
        }
        ((int*)p)[-1] = offset; // Changes the length of the string
        p[offset] = '\0';
    }
}

对于那些不想使用不安全或不相信字符串长度的黑客。

public static string ToAlphaNumeric(string input)
{
    int j = 0;
    char[] newCharArr = new char[input.Length];

    for (int i = 0; i < input.Length; i++)
    {
        if (char.IsLetterOrDigit(input[i]))
        {
            newCharArr[j] = input[i];
            j++;
        }
    }

    Array.Resize(ref newCharArr, j);

    return new string(newCharArr);
}

正则表达式为[^\w\s\-]*:

使用\s而不是space()更好,因为文本中可能有制表符。

如果你用JS工作,这里有一个非常简洁的版本

myString = myString.replace(/[^A-Za-z0-9 -]/g, "");

基于这个问题的答案,我创建了一个静态类并添加了这些。我觉得可能对某些人有用。

public static class RegexConvert
{
    public static string ToAlphaNumericOnly(this string input)
    {
        Regex rgx = new Regex("[^a-zA-Z0-9]");
        return rgx.Replace(input, "");
    }

    public static string ToAlphaOnly(this string input)
    {
        Regex rgx = new Regex("[^a-zA-Z]");
        return rgx.Replace(input, "");
    }

    public static string ToNumericOnly(this string input)
    {
        Regex rgx = new Regex("[^0-9]");
        return rgx.Replace(input, "");
    }
}

这些方法可用于:

string example = "asdf1234!@#$";
string alphanumeric = example.ToAlphaNumericOnly();
string alpha = example.ToAlphaOnly();
string numeric = example.ToNumericOnly();