为什么“bytes(n)”创建长度为n的字节字符串，而不是将n转换为二进制表示?

我试图在Python 3中构建这个bytes对象:

b'3\r\n'

所以我尝试了显而易见的(对我来说)，发现了一个奇怪的行为:

>>> bytes(3) + b'\r\n'
b'\x00\x00\x00\r\n'

显然:

>>> bytes(10)
b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00'

在阅读文档时，我无法看到字节转换为什么以这种方式工作的任何指针。然而，我确实在这个Python问题中发现了一些关于向字节添加格式的令人惊讶的消息(另见Python 3字节格式化):

http://bugs.python.org/issue3982

这与bytes(int)返回零这样的奇怪情况的交互更加糟糕

and:

如果字节(int)返回该int的ASCIIfication，对我来说会更方便;但说实话，即使是一个错误也比这种行为要好。(如果我想要这种行为——我从来没有——我宁愿它是一个类方法，像“bytes.zero (n)”那样调用。)

谁能给我解释一下这种行为是怎么来的?

当前回答

当你想要处理二进制表示时，最好使用ctypes。

import ctypes
x = ctypes.c_int(1234)
bytes(x)

你必须使用特定的整数表示(有符号/无符号和位数:c_uint8, c_int8, c_unit16，…)

2021-06-19 14:17:31

其他回答

3的ASCIIfication是“\x33”而不是“\x03”!

这就是python对str(3)所做的，但对字节来说是完全错误的，因为它们应该被认为是二进制数据的数组，而不应该被滥用为字符串。

实现您想要的最简单的方法是bytes((3，))，这比bytes([3])更好，因为初始化列表的代价要高得多，所以当您可以使用元组时，永远不要使用列表。可以使用int转换更大的整数。“小”,to_bytes(3)。

初始化具有给定长度的字节是有意义的，也是最有用的，因为它们通常用于创建某种类型的缓冲区，为此需要分配一定大小的内存。我经常在初始化数组或通过写入零来扩展某个文件时使用这个方法。

2015-08-01 10:40:11

这就是它的设计方式——这是有意义的，因为通常，你会在一个可迭代对象上调用bytes，而不是单个整数:

>>> bytes([3])
b'\x03'

文档声明了这一点，以及字节的文档字符串:

>>> help(bytes)
...
bytes(int) -> bytes object of size given by the parameter initialized with null bytes

2014-01-09 10:37:38

有些答案对大数字不适用。

将整数转换为十六进制表示，然后将其转换为字节:

def int_to_bytes(number):
    hrepr = hex(number).replace('0x', '')
    if len(hrepr) % 2 == 1:
        hrepr = '0' + hrepr
    return bytes.fromhex(hrepr)

结果:

>>> int_to_bytes(2**256 - 1)
b'\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff\xff'

2019-12-13 19:34:25

文件说:

bytes(int) -> bytes object of size given by the parameter
              initialized with null bytes

序列:

b'3\r\n'

它是字符“3”(十进制51)、字符“\r”(13)和“\n”(10)。

因此，方法会这样对待它，例如:

>>> bytes([51, 13, 10])
b'3\r\n'

>>> bytes('3', 'utf8') + b'\r\n'
b'3\r\n'

>>> n = 3
>>> bytes(str(n), 'ascii') + b'\r\n'
b'3\r\n'

在IPython 1.1.0和Python 3.2.3上测试

2014-01-09 13:15:12

来自bytes docs:

因此，构造函数参数被解释为bytearray()。

然后，从bytearray docs:

可选的source参数可以用几种不同的方式初始化数组: 如果它是一个整数，数组将具有该大小，并将初始化为空字节。

注意，它与2不同。X(其中X >= 6)行为，其中bytes是简单的str:

>>> bytes is str
True

PEP 3112:

2.6的str与3.0的bytes类型有很多不同之处;最值得注意的是，构造函数完全不同。

2014-01-09 10:39:02

为什么“bytes(n)”创建长度为n的字节字符串，而不是将n转换为二进制表示?

推荐文章

最新文章

标签