为什么sizeof运算符返回的结构大小大于结构成员的总大小?
当前回答
其思想是,出于速度和缓存的考虑,操作数应从与其自然大小对齐的地址中读取。为了实现这一点,编译器填充结构成员,以便对齐以下成员或以下结构。
struct pixel {
unsigned char red; // 0
unsigned char green; // 1
unsigned int alpha; // 4 (gotta skip to an aligned offset)
unsigned char blue; // 8 (then skip 9 10 11)
};
// next offset: 12
x86体系结构始终能够获取未对齐的地址。然而,它速度较慢,当未对齐与两个不同的缓存线重叠时,当对齐的访问只会逐出一个缓存线时,它会逐出两个缓存线。
有些架构实际上必须捕获未对齐的读写,而早期版本的ARM架构(演变成当今所有移动CPU的架构)。。。事实上,他们只是返回了这些错误的数据。(他们忽略了低位。)
最后,请注意缓存线可以任意大,编译器不会试图猜测这些缓存线,也不会做出空间与速度的权衡。相反,对齐决策是ABI的一部分,表示最终将均匀填充缓存行的最小对齐。
TL;DR:对齐很重要。
其他回答
上面给出了很多信息(解释)。
我只想分享一些方法来解决这个问题。
您可以通过添加pragma pack来避免它
#pragma pack(push, 1)
// your structure
#pragma pack(pop)
除了其他答案,结构可以(但通常不)具有虚拟函数,在这种情况下,结构的大小还将包括vtbl的空间。
例如,如果您希望结构具有GCC的特定大小,请使用__attribute__((打包))。
在Windows上,使用带有/Zp选项的cl.exe编译器时,可以将对齐设置为一个字节。
通常,CPU更容易访问4(或8)的倍数的数据,这取决于平台和编译器。
所以这基本上是一个对齐问题。
你需要有充分的理由来改变它。
这可能是由于字节对齐和填充,使得结构在您的平台上达到偶数字节(或单词)。例如,在Linux上的C中,以下3种结构:
#include "stdio.h"
struct oneInt {
int x;
};
struct twoInts {
int x;
int y;
};
struct someBits {
int x:2;
int y:6;
};
int main (int argc, char** argv) {
printf("oneInt=%zu\n",sizeof(struct oneInt));
printf("twoInts=%zu\n",sizeof(struct twoInts));
printf("someBits=%zu\n",sizeof(struct someBits));
return 0;
}
成员的大小(以字节为单位)分别为4字节(32位)、8字节(2x 32位)和1字节(2+6位)。上面的程序(在使用gcc的Linux上)将大小打印为4、8和4,其中最后一个结构填充为一个单词(在我的32位平台上为4 x 8位字节)。
oneInt=4
twoInts=8
someBits=4
如果隐式或显式设置了结构的对齐方式,则可以这样做。对齐为4的结构将始终是4字节的倍数,即使其成员的大小不是4字节的倍。
此外,一个库可以在x86下用32位int编译,并且您可以在64位进程上比较它的组件。如果您手动执行此操作,则会得到不同的结果。