如何将UTF-8字节[]转换为字符串

我有一个字节[]数组，从一个文件加载，我碰巧知道包含UTF-8。

在一些调试代码中，我需要将其转换为字符串。是否有一个单行程序可以做到这一点?

在表面之下，它应该只是一个分配和一个memcopy，所以即使没有实现，也应该是可能的。

当前回答

用于将从文件中读取的字节数组byteArrFilename转换为纯ASCII c风格以零结尾的字符串的LINQ一行程序如下:

String filename = new String(byteArrFilename.TakeWhile(x => x != 0)
                              .Select(x => x < 128 ? (Char)x : '?').ToArray());

我用'?'作为非纯ASCII的默认字符，当然，这是可以改变的。如果您想确保可以检测到它，只需使用'\0'，因为开始时的TakeWhile确保以这种方式构建的字符串不可能包含来自输入源的'\0'值。

2016-11-17 08:12:28

其他回答

试试这个控制台应用程序:

static void Main(string[] args)
{
    //Encoding _UTF8 = Encoding.UTF8;
    string[] _mainString = { "Hello, World!" };
    Console.WriteLine("Main String: " + _mainString);

    // Convert a string to UTF-8 bytes.
    byte[] _utf8Bytes = Encoding.UTF8.GetBytes(_mainString[0]);

    // Convert UTF-8 bytes to a string.
    string _stringuUnicode = Encoding.UTF8.GetString(_utf8Bytes);
    Console.WriteLine("String Unicode: " + _stringuUnicode);
}

2019-09-29 07:49:57

用于将从文件中读取的字节数组byteArrFilename转换为纯ASCII c风格以零结尾的字符串的LINQ一行程序如下:

String filename = new String(byteArrFilename.TakeWhile(x => x != 0)
                              .Select(x => x < 128 ? (Char)x : '?').ToArray());

2016-11-17 08:12:28

将字节[]转换为字符串似乎很简单，但任何一种编码都有可能把输出字符串弄乱。这个小函数只是工作，没有任何意想不到的结果:

private string ToString(byte[] bytes)
{
    string response = string.Empty;

    foreach (byte b in bytes)
        response += (Char)b;

    return response;
}

2015-04-22 11:48:35

据我所知，没有一个给出的答案保证正确的行为与空终止。直到有人告诉我不同的，我写了自己的静态类处理以下方法:

// Mimics the functionality of strlen() in c/c++
// Needed because niether StringBuilder or Encoding.*.GetString() handle \0 well
static int StringLength(byte[] buffer, int startIndex = 0)
{
    int strlen = 0;
    while
    (
        (startIndex + strlen + 1) < buffer.Length // Make sure incrementing won't break any bounds
        && buffer[startIndex + strlen] != 0       // The typical null terimation check
    )
    {
        ++strlen;
    }
    return strlen;
}

// This is messy, but I haven't found a built-in way in c# that guarentees null termination
public static string ParseBytes(byte[] buffer, out int strlen, int startIndex = 0)
{
    strlen = StringLength(buffer, startIndex);
    byte[] c_str = new byte[strlen];
    Array.Copy(buffer, startIndex, c_str, 0, strlen);
    return Encoding.UTF8.GetString(c_str);
}

使用startIndex的原因是在我正在处理的示例中，我需要将byte[]解析为一个以null结尾的字符串数组。在简单的情况下，可以安全地忽略它

2017-06-29 00:19:13

string result = ASCIIEncoding.UTF8.GetString(byteArray);

2021-11-02 13:38:49

如何将UTF-8字节[]转换为字符串

推荐文章

最新文章

标签