我有UTF-8编码的NSData从windows服务器,我想把它转换为NSString为iPhone。由于数据包含在两个平台上有不同值的字符(如度符号),我如何将数据转换为字符串?


当前回答

在Swift 5中,你可以使用String的init(data:encoding:)初始化式,以便使用UTF-8将一个data实例转换为String实例。Init (data:encoding:)有如下声明:

init?(data: Data, encoding: String.Encoding)

返回使用给定编码将给定数据转换为Unicode字符初始化的String。

下面的Playground代码展示了如何使用它:

import Foundation

let json = """
{
"firstName" : "John",
"lastName" : "Doe"
}
"""

let data = json.data(using: String.Encoding.utf8)!

let optionalString = String(data: data, encoding: String.Encoding.utf8)
print(String(describing: optionalString))

/*
 prints:
 Optional("{\n\"firstName\" : \"John\",\n\"lastName\" : \"Doe\"\n}")
*/

其他回答

如果数据不是以空结束的,你应该使用-initWithData:encoding:

NSString* newStr = [[NSString alloc] initWithData:theData encoding:NSUTF8StringEncoding];

如果数据是以空结束的,你应该使用-stringWithUTF8String:来避免在结尾出现额外的\0。

NSString* newStr = [NSString stringWithUTF8String:[theData bytes]];

(注意,如果输入不是正确的utf -8编码,你将得到nil。)


斯威夫特变体:

let newStr = String(data: data, encoding: .utf8)
// note that `newStr` is a `String?`, not a `String`.

如果数据以空结束,你可以采用安全的方法,即删除空字符,或者采用类似于上面Objective-C版本的不安全方法。

// safe way, provided data is \0-terminated
let newStr1 = String(data: data.subdata(in: 0 ..< data.count - 1), encoding: .utf8)
// unsafe way, provided data is \0-terminated
let newStr2 = data.withUnsafeBytes(String.init(utf8String:))

从字符串到数据再回到字符串的Swift版本:

Xcode 10.1•Swift 4.2.1

extension Data {
    var string: String? {
        return String(data: self, encoding: .utf8)
    }
}

extension StringProtocol {
    var data: Data {
        return Data(utf8)
    }
}

extension String {
    var base64Decoded: Data? {
        return Data(base64Encoded: self)
    }
}

操场上

let string = "Hello World"                                  // "Hello World"
let stringData = string.data                                // 11 bytes
let base64EncodedString = stringData.base64EncodedString()  // "SGVsbG8gV29ybGQ="
let stringFromData = stringData.string                      // "Hello World"

let base64String = "SGVsbG8gV29ybGQ="
if let data = base64String.base64Decoded {
    print(data)                                    //  11 bytes
    print(data.base64EncodedString())              // "SGVsbG8gV29ybGQ="
    print(data.string ?? "nil")                    // "Hello World"
}

let stringWithAccent = "Olá Mundo"                          // "Olá Mundo"
print(stringWithAccent.count)                               // "9"
let stringWithAccentData = stringWithAccent.data            // "10 bytes" note: an extra byte for the acute accent
let stringWithAccentFromData = stringWithAccentData.string  // "Olá Mundo\n"

总结一下,这里有一个完整的答案,对我来说很管用。

我的问题是当我吸毒的时候

[NSString stringWithUTF8String:(char *)data.bytes];

我得到的字符串是不可预测的:大约70%的字符串包含了预期的值,但结果往往是Null,甚至更糟:在字符串的末尾被丢弃。

经过一番挖掘,我切换到

[[NSString alloc] initWithBytes:(char *)data.bytes length:data.length encoding:NSUTF8StringEncoding];

每次都得到了预期的结果。

你可以调用这个方法

+(id)stringWithUTF8String:(const char *)bytes.

在Swift 5中,你可以使用String的init(data:encoding:)初始化式,以便使用UTF-8将一个data实例转换为String实例。Init (data:encoding:)有如下声明:

init?(data: Data, encoding: String.Encoding)

返回使用给定编码将给定数据转换为Unicode字符初始化的String。

下面的Playground代码展示了如何使用它:

import Foundation

let json = """
{
"firstName" : "John",
"lastName" : "Doe"
}
"""

let data = json.data(using: String.Encoding.utf8)!

let optionalString = String(data: data, encoding: String.Encoding.utf8)
print(String(describing: optionalString))

/*
 prints:
 Optional("{\n\"firstName\" : \"John\",\n\"lastName\" : \"Doe\"\n}")
*/