UTF-8字节[]到字符串

让我们假设我刚刚使用BufferedInputStream将UTF-8编码文本文件的字节读入字节数组。我知道我可以使用下面的例程将字节转换为字符串，但是是否有一种更有效/更聪明的方法来做到这一点，而不仅仅是遍历字节并转换每个字节?

public String openFileToString(byte[] _bytes)
{
    String file_string = "";

    for(int i = 0; i < _bytes.length; i++)
    {
        file_string += (char)_bytes[i];
    }

    return file_string;    
}

当前回答

Java String类有一个内置的构造函数，用于将字节数组转换为字符串。

byte[] byteArray = new byte[] {87, 79, 87, 46, 46, 46};

String value = new String(byteArray, "UTF-8");

2011-12-14 21:49:52

其他回答

为什么不从一开始就得到你要找的东西，从文件中读取一个字符串，而不是一个字节数组呢?喜欢的东西:

BufferedReader in = new BufferedReader(new InputStreamReader( new FileInputStream( "foo.txt"), Charset.forName( "UTF-8"));

然后从内读取line，直到完成。

2011-12-14 22:01:47

知道您正在处理一个UTF-8字节数组，您肯定希望使用接受字符集名称的String构造函数。否则，您可能会面临一些基于字符集编码的安全漏洞。注意，它会抛出UnsupportedEncodingException，这是你必须处理的。就像这样:

public String openFileToString(String fileName) {
    String file_string;
    try {
        file_string = new String(_bytes, "UTF-8");
    } catch (UnsupportedEncodingException e) {
        // this should never happen because "UTF-8" is hard-coded.
        throw new IllegalStateException(e);
    }
    return file_string;
}

2011-12-14 21:52:03

我用这种方法

String String = new String(_bytes, 0, numBytes);

2017-04-17 10:21:40

为此，您可以使用String(byte[] bytes)构造函数。详情请参见此链接。你还必须考虑你的平台的默认字符集，根据java文档:

使用解码指定的字节数组来构造新的String 平台的默认字符集。新字符串的长度是a 函数的字符集，因此可能不等于长度字节数组。当给定字节时，此构造函数的行为在未指定的默认字符集中无效。的类时，应该使用CharsetDecoder类解码过程是必需的。

2011-12-14 21:48:53

这也涉及到迭代，但这比连接字符串好得多，因为它们非常非常昂贵。

public String openFileToString(String fileName)
{
    StringBuilder s = new StringBuilder(_bytes.length);

    for(int i = 0; i < _bytes.length; i++)
    {
        s.append((char)_bytes[i]);
    }

    return s.toString();    
}

2011-12-14 21:49:24

UTF-8字节[]到字符串

推荐文章

最新文章

标签