JSON字符串中的二进制数据。比Base64更好

JSON格式本身不支持二进制数据。二进制数据必须转义，以便可以将其放在JSON中的字符串元素中(即使用反斜杠转义的双引号中的零或多个Unicode字符)。

转义二进制数据的一个明显方法是使用Base64。然而，Base64有很高的处理开销。此外，它将3个字节扩展为4个字符，导致数据大小增加约33%。

其中一个用例是CDMI云存储API规范的0.8版草案。您可以使用JSON通过REST-Webservice创建数据对象，例如:

PUT /MyContainer/BinaryObject HTTP/1.1
Host: cloud.example.com
Accept: application/vnd.org.snia.cdmi.dataobject+json
Content-Type: application/vnd.org.snia.cdmi.dataobject+json
X-CDMI-Specification-Version: 1.0
{
    "mimetype" : "application/octet-stream",
    "metadata" : [ ],
    "value" :   "TWFuIGlzIGRpc3Rpbmd1aXNoZWQsIG5vdCBvbmx5IGJ5IGhpcyByZWFzb24sIGJ1dCBieSB0aGlz
    IHNpbmd1bGFyIHBhc3Npb24gZnJvbSBvdGhlciBhbmltYWxzLCB3aGljaCBpcyBhIGx1c3Qgb2Yg
    dGhlIG1pbmQsIHRoYXQgYnkgYSBwZXJzZXZlcmFuY2Ugb2YgZGVsaWdodCBpbiB0aGUgY29udGlu
    dWVkIGFuZCBpbmRlZmF0aWdhYmxlIGdlbmVyYXRpb24gb2Yga25vd2xlZGdlLCBleGNlZWRzIHRo
    ZSBzaG9ydCB2ZWhlbWVuY2Ugb2YgYW55IGNhcm5hbCBwbGVhc3VyZS4=",
}

是否有更好的方法和标准方法将二进制数据编码为JSON字符串?

当前回答

在讨论中加入资源和复杂性的观点。由于使用PUT/POST和PATCH来存储和修改新资源，所以应该记住，内容传输是通过发出GET操作来存储和接收的内容的精确表示。

多部分信息通常被用作救星，但出于简单的原因和更复杂的任务，我更喜欢将内容作为一个整体来提供。它是不言自明的，而且很简单。

JSON确实很麻烦，但最终JSON本身也很冗长。而且映射到BASE64的开销也很小。

正确使用Multi-Part消息，必须拆除要发送的对象，使用属性路径作为自动组合的参数名称，或者需要创建另一种协议/格式来表达有效负载。

同样喜欢BSON方法，这并不像人们所希望的那样被广泛和容易支持。

基本上，我们在这里漏掉了一些东西，但是将二进制数据嵌入为base64是很好的方法，除非您确实确定需要进行真正的二进制传输(这很少是这样的情况)。

2016-04-12 11:13:31

其他回答

yEnc可能适合你:

http://en.wikipedia.org/wiki/Yenc

"yEnc is a binary-to-text encoding scheme for transferring binary files in [text]. It reduces the overhead over previous US-ASCII-based encoding methods by using an 8-bit Extended ASCII encoding method. yEnc's overhead is often (if each byte value appears approximately with the same frequency on average) as little as 1–2%, compared to 33%–40% overhead for 6-bit encoding methods like uuencode and Base64. ... By 2003 yEnc became the de facto standard encoding system for binary files on Usenet."

然而，yEnc是一种8位编码，因此将其存储在JSON字符串中与存储原始二进制数据有相同的问题-使用naïve方式意味着大约100%的展开，这比base64更糟糕。

2009-09-18 08:12:07

由于您正在寻找将二进制数据硬塞进严格基于文本且非常有限的格式的能力，我认为Base64的开销与您期望使用JSON维护的便利性相比是最小的。如果需要考虑处理能力和吞吐量，那么可能需要重新考虑文件格式。

2009-09-18 08:29:14

我也遇到了同样的问题，我想分享一个解决方案:multipart/form-data。

通过发送一个多部分的表单，你首先将你的JSON元数据作为字符串发送，然后分别以原始二进制(图像，波浪等)以Content-Disposition名称为索引发送。

这里有一个很好的教程，教你如何在obj-c中做到这一点，这里有一篇博客文章，解释了如何用表单边界划分字符串数据，并将其与二进制数据分开。

你真正需要做的唯一改变是在服务器端;你必须捕获你的元数据，它应该适当地引用POST的二进制数据(通过使用Content-Disposition边界)。

尽管这需要在服务器端进行额外的工作，但如果您要发送许多图像或大型图像，这是值得的。如果需要，可以将其与gzip压缩结合使用。

在我看来，发送base64编码的数据是一种黑客行为;RFC multipart/form-data是针对以下问题创建的:将二进制数据与文本或元数据结合发送。

2015-01-22 02:31:31

在深度上

I dig a little bit more (during implementation of base128), and expose that when we send characters which ascii codes are bigger than 128 then browser (chrome) in fact send TWO characters (bytes) instead one :(. The reason is that JSON by defaul use utf8 characters for which characters with ascii codes above 127 are coded by two bytes what was mention by chmike answer. I made test in this way: type in chrome url bar chrome://net-export/ , select "Include raw bytes", start capturing, send POST requests (using snippet at the bottom), stop capturing and save json file with raw requests data. Then we look inside that json file:

We can find our base64 request by finding string 4142434445464748494a4b4c4d4e this is hex coding of ABCDEFGHIJKLMN and we will see that "byte_count": 639 for it. We can find our above127 request by finding string C2BCC2BDC380C381C382C383C384C385C386C387C388C389C38AC38B this are request-hex utf8 codes of characters ¼½ÀÁÂÃÄÅÆÇÈÉÊË (however the ascii hex codes of this characters are c1c2c3c4c5c6c7c8c9cacbcccdce). The "byte_count": 703 so it is 64bytes longer than base64 request because characters with ascii codes above 127 are code by 2 bytes in request :(

所以事实上，发送带有代码>127的字符并没有什么好处。对于base64字符串，我们没有观察到这样的负面行为(可能对于base85也是如此-我不检查它)-然而，这个问题的一些解决方案将以POST multipart/form-data的二进制部分发送数据，在Ælex回答中描述(然而通常在这种情况下，我们根本不需要使用任何基本编码…)

另一种方法可能依赖于通过使用base65280 / base65k之类的代码将两个字节的数据部分映射到一个有效的utf8字符，但由于utf8规范，它可能不如base64有效……

function postBase64() { let formData = new FormData(); let req = new XMLHttpRequest(); formData.append("base64ch", "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"); req.open("POST", '/testBase64ch'); req.send(formData); } function postAbove127() { let formData = new FormData(); let req = new XMLHttpRequest(); formData.append("above127", "¼½ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõö÷øùúûüý"); req.open("POST", '/testAbove127'); req.send(formData); } <button onclick=postBase64()>POST base64 chars</button> <button onclick=postAbove127()>POST chars with codes>127</button>

2018-11-03 20:30:49

BSON(二进制JSON)可能适合你。 http://en.wikipedia.org/wiki/BSON

编辑: 供你参考。net库json.net支持读写bson，如果你正在寻找一些c#服务器端的爱好。

2011-09-20 21:45:29

JSON字符串中的二进制数据。比Base64更好

推荐文章

最新文章

标签