为什么sizeof运算符返回的结构大小大于结构成员的总大小?
当前回答
在关于内存对齐和结构填充/打包的其他解释得很好的答案中,我通过仔细阅读问题本身发现了一些东西。
“为什么结构的sizeof不等于每个成员的sizeof之和?”“为什么sizeof运算符返回的结构大小大于结构成员的总大小”?
这两个问题都表明了一些明显的错误。至少在一般的、非示例性的视图中是这样的。
应用于结构对象的sizeof操作数的结果可以等于分别应用于每个成员的sizeof之和。它不一定要更大/不同。
如果没有填充的原因,则不会填充内存。
如果结构仅包含相同类型的成员,则大多数实现为:
struct foo {
int a;
int b;
int c;
} bar;
假设sizeof(int)==4,结构杆的尺寸将等于所有构件的尺寸总和,sizeof(bar)==12。这里没有填充。
同样的例子如下:
struct foo {
short int a;
short int b;
int c;
} bar;
假设sizeof(short int)==2,sizeof(int)==4。为a和b分配的字节之和等于为c分配的字节,c是最大的成员,因此所有内容都完全对齐。因此,sizeof(bar)==8。
这也是关于结构填充的第二个最受欢迎的问题的对象,这里:
C结构中的内存对齐
其他回答
除了其他答案,结构可以(但通常不)具有虚拟函数,在这种情况下,结构的大小还将包括vtbl的空间。
C99 N1256标准草案
http://www.open-std.org/JTC1/SC22/WG14/www/docs/n1256.pdf
6.5.3.4操作员尺寸:
3当应用于具有结构或并集类型的操作数时,结果是这样的对象中的字节总数,包括内部和尾部衬垫。
6.7.2.1结构和接头规范:
13 ... 可能有未命名的在结构对象内填充,但不能在其开头填充。
and:
15在结构或联合体的末端可能有未命名的填充。
新的C99灵活数组成员特性(结构S{int is[];};)也可能影响填充:
16作为一种特殊情况,具有多个命名构件的结构的最后一个元素可以具有不完整的数组类型;这称为灵活阵列成员。在大多数情况下,柔性阵列成员被忽略。特别是,结构的大小似乎省略了灵活的数组成员,除了它可能具有比这一遗漏意味着。
附件J便携性问题重申:
以下未指定:。。。在结构或联合中存储值时填充字节的值(6.2.6.1)
C++11 N3337标准草案
http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2012/n3337.pdf
5.3.3尺寸:
2应用时对于类,结果是该类的对象中的字节数,包括将该类型的对象放置在数组中。
9.2班级成员:
指向标准布局结构对象的指针(使用reinterpret_cast进行适当转换)指向其初始成员(或者如果该成员是位字段,则返回到它所在的单元),反之亦然。[注:因此,在标准布局结构对象中可能存在未命名的填充,必要时实现适当的对齐。-尾注]
我只知道足够的C++来理解注释:-)
打包和字节对齐,如C常见问题解答中所述:
这是为了对齐。许多处理器无法访问2字节和4字节数量(例如整数和长整数),如果它们被塞进每个方向。假设您有这样的结构:结构{字符a[3];短整数b;长整型c;字符d[3];};现在,你可能认为应该可以打包这个结构如下:+-------+-------+-------+-------+|a | b|+-------+-------+-------+-------+|b | c|+-------+-------+-------+-------+|c | d(c | d)|+-------+-------+-------+-------+但如果编译器安排,则处理器上的操作要简单得多它是这样的:+-------+-------+-------+|一个|+-------+-------+-------+|b级|+-------+-------+-------+-------+|c类|+-------+-------+-------+-------+|d)|+-------+-------+-------+在打包版本中,请注意,对于你和我想看看b和c字段是如何换行的?简而言之处理器也很难。因此,大多数编译器都会填充结构(好像有额外的、不可见的字段)如下:+-------+-------+-------+-------+|a |焊盘1|+-------+-------+-------+-------+|b |焊盘2|+-------+-------+-------+-------+|c类|+-------+-------+-------+-------+|d|焊盘3|+-------+-------+-------+-------+
另请参见:
对于Microsoft Visual C:
http://msdn.microsoft.com/en-us/library/2e70t5y1%28v=vs.80%29.aspx
GCC声称与微软编译器兼容
https://gcc.gnu.org/onlinedocs/gcc-4.6.4/gcc/Structure_002dPacking-Pragmas.html
除了前面的答案,请注意,无论包装如何,C++中没有成员订单保证。编译器可以(当然也可以)向结构中添加虚拟表指针和基结构的成员。即使是虚拟表的存在也没有得到标准的保证(没有规定虚拟机制的实现),因此可以得出这样的保证是不可能的。
我很确定C语言保证了成员顺序,但在编写跨平台或跨编译器程序时,我不会指望它。
其思想是,出于速度和缓存的考虑,操作数应从与其自然大小对齐的地址中读取。为了实现这一点,编译器填充结构成员,以便对齐以下成员或以下结构。
struct pixel {
unsigned char red; // 0
unsigned char green; // 1
unsigned int alpha; // 4 (gotta skip to an aligned offset)
unsigned char blue; // 8 (then skip 9 10 11)
};
// next offset: 12
x86体系结构始终能够获取未对齐的地址。然而,它速度较慢,当未对齐与两个不同的缓存线重叠时,当对齐的访问只会逐出一个缓存线时,它会逐出两个缓存线。
有些架构实际上必须捕获未对齐的读写,而早期版本的ARM架构(演变成当今所有移动CPU的架构)。。。事实上,他们只是返回了这些错误的数据。(他们忽略了低位。)
最后,请注意缓存线可以任意大,编译器不会试图猜测这些缓存线,也不会做出空间与速度的权衡。相反,对齐决策是ABI的一部分,表示最终将均匀填充缓存行的最小对齐。
TL;DR:对齐很重要。