为什么sizeof运算符返回的结构大小大于结构成员的总大小?


当前回答

其思想是,出于速度和缓存的考虑,操作数应从与其自然大小对齐的地址中读取。为了实现这一点,编译器填充结构成员,以便对齐以下成员或以下结构。

struct pixel {
    unsigned char red;   // 0
    unsigned char green; // 1
    unsigned int alpha;  // 4 (gotta skip to an aligned offset)
    unsigned char blue;  // 8 (then skip 9 10 11)
};

// next offset: 12

x86体系结构始终能够获取未对齐的地址。然而,它速度较慢,当未对齐与两个不同的缓存线重叠时,当对齐的访问只会逐出一个缓存线时,它会逐出两个缓存线。

有些架构实际上必须捕获未对齐的读写,而早期版本的ARM架构(演变成当今所有移动CPU的架构)。。。事实上,他们只是返回了这些错误的数据。(他们忽略了低位。)

最后,请注意缓存线可以任意大,编译器不会试图猜测这些缓存线,也不会做出空间与速度的权衡。相反,对齐决策是ABI的一部分,表示最终将均匀填充缓存行的最小对齐。

TL;DR:对齐很重要。

其他回答

结构的尺寸大于其部件的总和,这是因为所谓的填充。一个特定的处理器有一个首选的数据大小。大多数现代处理器的首选大小为32位(4字节)。当数据位于这种边界上时,访问内存比跨越这种大小边界的东西更有效。

例如考虑简单的结构:

struct myStruct
{
   int a;
   char b;
   int c;
} data;

如果机器是32位机器,并且数据在32位边界上对齐,我们会看到一个直接的问题(假设没有结构对齐)。在此示例中,让我们假设结构数据从地址1024开始(0x400-请注意,最低2位为零,因此数据与32位边界对齐)。对data.a的访问将正常工作,因为它从边界0x400开始。对data.b的访问也会很好,因为它位于地址0x404——另一个32位边界。但未对齐的结构将把data.c放在地址0x405。数据.c的4个字节位于0x405、0x406、0x407、0x408。在32位机器上,系统将在一个内存周期内读取data.c,但只能获得4个字节中的3个字节(第4个字节位于下一个边界)。因此,系统必须进行第二次内存访问以获得第四个字节,

现在,如果编译器不将data.c放在地址0x405,而是将结构填充3字节,并将data.c放到地址0x408,那么系统只需要1个周期就可以读取数据,从而将对该数据元素的访问时间减少50%。填充以内存效率换取处理效率。考虑到计算机可以拥有大量的内存(许多千兆字节),编译器认为这种交换(速度与大小)是合理的。

不幸的是,当您试图通过网络发送结构,甚至将二进制数据写入二进制文件时,这个问题就成了一个杀手。在结构或类的元素之间插入的填充会破坏发送到文件或网络的数据。为了编写可移植的代码(一个将被几个不同的编译器使用),您可能必须分别访问结构的每个元素,以确保正确的“打包”。

另一方面,不同的编译器有不同的能力来管理数据结构打包。例如,在Visual C/C++中,编译器支持#pragma pack命令。这将允许您调整数据打包和对齐。

例如:

#pragma pack 1
struct MyStruct
{
    int a;
    char b;
    int c;
    short d;
} myData;

I = sizeof(myData);

我现在的长度应该是11。如果没有pragma,我可以从11到14(对于某些系统,可以多达32),这取决于编译器的默认打包。

上面给出了很多信息(解释)。

我只想分享一些方法来解决这个问题。

您可以通过添加pragma pack来避免它

#pragma pack(push, 1)

// your structure

#pragma pack(pop) 

另请参见:

对于Microsoft Visual C:

http://msdn.microsoft.com/en-us/library/2e70t5y1%28v=vs.80%29.aspx

GCC声称与微软编译器兼容

https://gcc.gnu.org/onlinedocs/gcc-4.6.4/gcc/Structure_002dPacking-Pragmas.html

除了前面的答案,请注意,无论包装如何,C++中没有成员订单保证。编译器可以(当然也可以)向结构中添加虚拟表指针和基结构的成员。即使是虚拟表的存在也没有得到标准的保证(没有规定虚拟机制的实现),因此可以得出这样的保证是不可能的。

我很确定C语言保证了成员顺序,但在编写跨平台或跨编译器程序时,我不会指望它。

这可能是由于字节对齐和填充,使得结构在您的平台上达到偶数字节(或单词)。例如,在Linux上的C中,以下3种结构:

#include "stdio.h"


struct oneInt {
  int x;
};

struct twoInts {
  int x;
  int y;
};

struct someBits {
  int x:2;
  int y:6;
};


int main (int argc, char** argv) {
  printf("oneInt=%zu\n",sizeof(struct oneInt));
  printf("twoInts=%zu\n",sizeof(struct twoInts));
  printf("someBits=%zu\n",sizeof(struct someBits));
  return 0;
}

成员的大小(以字节为单位)分别为4字节(32位)、8字节(2x 32位)和1字节(2+6位)。上面的程序(在使用gcc的Linux上)将大小打印为4、8和4,其中最后一个结构填充为一个单词(在我的32位平台上为4 x 8位字节)。

oneInt=4
twoInts=8
someBits=4

例如,如果您希望结构具有GCC的特定大小,请使用__attribute__((打包))。

在Windows上,使用带有/Zp选项的cl.exe编译器时,可以将对齐设置为一个字节。

通常,CPU更容易访问4(或8)的倍数的数据,这取决于平台和编译器。

所以这基本上是一个对齐问题。

你需要有充分的理由来改变它。