在哪个区段?BSS, .DATA,其他)的可执行文件的静态变量存储,以便他们没有名称冲突? 例如:


foo.c:                         bar.c:
static int foo = 1;            static int foo = 10;
void fooTest() {               void barTest() {
  static int bar = 2;            static int bar = 20;
  foo++;                         foo++;
  bar++;                         bar++;
  printf("%d,%d", foo, bar);     printf("%d, %d", foo, bar);
}                              }

如果我编译这两个文件并将其链接到重复调用fooTest()和barTest的主程序,printf语句将独立递增。这是有意义的,因为foo和bar变量是翻译单元的局部变量。

但是存储分配在哪里呢?

需要明确的是,假设您有一个工具链,该工具链将以ELF格式输出文件。因此,我认为在可执行文件中必须为那些静态变量保留一些空间。 为了便于讨论,让我们假设我们使用GCC工具链。


当前回答

当程序加载到内存中时,它被组织成不同的段。其中一个段是DATA段。数据段进一步细分为两部分:

初始化数据段:所有全局、静态和常量数据都存储在这里。 未初始化数据段(BSS):所有未初始化的数据都存储在这个段中。

下面是一个图表来解释这个概念:

这里有一个很好的链接解释这些概念:C中的内存管理:堆和堆栈

其他回答

好吧,这个问题有点太老了,但既然没有人指出任何有用的信息: 查看'mohit12379'的帖子,解释了在符号表中存储同名静态变量的方法: http://www.geekinterview.com/question_details/24745

这取决于你使用的平台和编译器。有些编译器直接存储在代码段中。静态变量总是只能被当前的翻译单元访问,并且名称不会被导出,因此名称冲突永远不会发生。

如何用objdump -Sr自己找到它

要真正理解发生了什么,您必须理解连接器重定位。如果你从未接触过,考虑先阅读这篇文章。

让我们来分析一个Linux x86-64 ELF的例子,看看它自己:

#include <stdio.h>

int f() {
    static int i = 1;
    i++;
    return i;
}

int main() {
    printf("%d\n", f());
    printf("%d\n", f());
    return 0;
}

编译:

gcc -ggdb -c main.c

用以下方法反编译代码:

objdump -Sr main.o

-S混合原始源代码反编译代码 -r显示重定位信息

在f的反编译中,我们看到:

 static int i = 1;
 i++;
4:  8b 05 00 00 00 00       mov    0x0(%rip),%eax        # a <f+0xa>
        6: R_X86_64_PC32    .data-0x4

而.data-0x4表示它将到。data段的第一个字节。

-0x4的存在是因为我们正在使用RIP相对寻址,因此指令中的% RIP和R_X86_64_PC32。

它是必需的,因为RIP指向下面的指令,它在00 00 00 00 00之后4个字节开始,00 00 00 00将被重新定位。我已经在https://stackoverflow.com/a/30515926/895245上详细解释了这一点

然后,如果我们将源修改为i = 1,并进行同样的分析,我们得出:

静态int I = 0是。bss 静态int I = 1在。data上

如前所述,存储在数据段或代码段中的静态变量。 您可以确保它不会被分配到堆栈或堆上。 没有碰撞风险,因为static关键字定义变量的范围为文件或函数,如果发生碰撞,有编译器/链接器警告你。

在编译单元中声明的数据将进入该文件输出的. bss或.Data。BSS中初始化的数据,data中未初始化的数据。

静态数据和全局数据之间的区别在于文件中包含的符号信息。编译器倾向于包含符号信息,但只标记全局信息。

链接器尊重这些信息。静态变量的符号信息要么被丢弃,要么被破坏,这样静态变量仍然可以以某种方式引用(使用调试或符号选项)。在这两种情况下,编译单元都不会因为链接器首先解析本地引用而受到影响。