JSON字符串中的二进制数据。比Base64更好

JSON格式本身不支持二进制数据。二进制数据必须转义，以便可以将其放在JSON中的字符串元素中(即使用反斜杠转义的双引号中的零或多个Unicode字符)。

转义二进制数据的一个明显方法是使用Base64。然而，Base64有很高的处理开销。此外，它将3个字节扩展为4个字符，导致数据大小增加约33%。

其中一个用例是CDMI云存储API规范的0.8版草案。您可以使用JSON通过REST-Webservice创建数据对象，例如:

PUT /MyContainer/BinaryObject HTTP/1.1
Host: cloud.example.com
Accept: application/vnd.org.snia.cdmi.dataobject+json
Content-Type: application/vnd.org.snia.cdmi.dataobject+json
X-CDMI-Specification-Version: 1.0
{
    "mimetype" : "application/octet-stream",
    "metadata" : [ ],
    "value" :   "TWFuIGlzIGRpc3Rpbmd1aXNoZWQsIG5vdCBvbmx5IGJ5IGhpcyByZWFzb24sIGJ1dCBieSB0aGlz
    IHNpbmd1bGFyIHBhc3Npb24gZnJvbSBvdGhlciBhbmltYWxzLCB3aGljaCBpcyBhIGx1c3Qgb2Yg
    dGhlIG1pbmQsIHRoYXQgYnkgYSBwZXJzZXZlcmFuY2Ugb2YgZGVsaWdodCBpbiB0aGUgY29udGlu
    dWVkIGFuZCBpbmRlZmF0aWdhYmxlIGdlbmVyYXRpb24gb2Yga25vd2xlZGdlLCBleGNlZWRzIHRo
    ZSBzaG9ydCB2ZWhlbWVuY2Ugb2YgYW55IGNhcm5hbCBwbGVhc3VyZS4=",
}

是否有更好的方法和标准方法将二进制数据编码为JSON字符串?

当前回答

根据JSON规范，有94个Unicode字符可以表示为一个字节(如果您的JSON以UTF-8传输)。考虑到这一点，我认为最好的空格方式是base85，它将四个字节表示为五个字符。然而，这只比base64提高了7%，它的计算成本更高，实现也不像base64那么常见，所以它可能不是一个胜利。

您还可以简单地将每个输入字节映射到U+0000-U+00FF中的相应字符，然后执行JSON标准所需的最小编码来传递这些字符;这里的优点是，除了内置函数之外，所需的解码为nil，但空间效率很差——105%的扩展(如果所有输入字节的可能性相等)，而base85为25%，base64为33%。

最终结论:在我看来，base64胜出，因为它是常见的、简单的，而且还没有坏到需要替换的地步。

参见:Base91和Base122

2009-09-18 08:33:11

其他回答

yEnc可能适合你:

http://en.wikipedia.org/wiki/Yenc

"yEnc is a binary-to-text encoding scheme for transferring binary files in [text]. It reduces the overhead over previous US-ASCII-based encoding methods by using an 8-bit Extended ASCII encoding method. yEnc's overhead is often (if each byte value appears approximately with the same frequency on average) as little as 1–2%, compared to 33%–40% overhead for 6-bit encoding methods like uuencode and Base64. ... By 2003 yEnc became the de facto standard encoding system for binary files on Usenet."

然而，yEnc是一种8位编码，因此将其存储在JSON字符串中与存储原始二进制数据有相同的问题-使用naïve方式意味着大约100%的展开，这比base64更糟糕。

2009-09-18 08:12:07

(7年后编辑:谷歌Gears消失了。忽略这个答案。)

谷歌Gears团队遇到了缺少二进制数据类型的问题，并试图解决它:

Blob API JavaScript为文本字符串提供了内置的数据类型，但没有用于二进制数据的数据类型。Blob对象试图解决这个限制。

也许你可以想办法编进去。

2009-09-18 08:30:56

如果要处理带宽问题，请先尝试在客户端压缩数据，然后再使用base64-it。

关于这种魔力的一个很好的例子是在http://jszip.stuartk.co.uk/，关于这个主题的更多讨论是在Gzip的JavaScript实现中

2011-03-15 09:54:00

数据类型非常重要。我已经测试了从RESTful资源发送有效负载的不同场景。编码我使用Base64(Apache)和压缩GZIP(java.utils.zip.*)。有效载荷包含关于电影、图像和音频文件的信息。我已经压缩和编码了图像和音频文件，这大大降低了性能。在压缩之前进行编码效果很好。图像和音频内容以编码和压缩字节[]的形式发送。

2012-04-02 16:51:46

微笑的格式

它的编码、解码和压缩非常快

速度比较(基于java，但仍有意义):https://github.com/eishay/jvm-serializers/wiki/

此外，它也是JSON的一个扩展，允许您跳过字节数组的base64编码

Smile编码的字符串可以在空间紧缺时进行gzip压缩

2012-01-06 23:42:01

JSON字符串中的二进制数据。比Base64更好

推荐文章

最新文章

标签