如果我有一个变量在一个函数(说,一个大数组),它有意义的声明它既静态和constexpr?Constexpr保证数组是在编译时创建的,所以静态是无用的吗?

void f() {
    static constexpr int x [] = {
        // a few thousand elements
    };
    // do something with the array
}

在生成的代码或语义方面,静态实际上做了什么吗?


当前回答

不使大型数组静态,即使它们是constexpr,也会对性能产生巨大影响,并可能导致许多错过的优化。它可能会以数量级降低代码的速度。你的变量仍然是本地的,编译器可能决定在运行时初始化它们,而不是将它们作为数据存储在可执行文件中。

考虑下面的例子:

template <int N>
void foo();

void bar(int n)
{
    // array of four function pointers to void(void)
    constexpr void(*table[])(void) {
        &foo<0>,
        &foo<1>,
        &foo<2>,
        &foo<3>
    };
    // look up function pointer and call it
    table[n]();
}

你可能希望gcc-10 -O3将bar()编译为一个jmp,它从一个表中获取一个地址,但事实并非如此:

bar(int):
        mov     eax, OFFSET FLAT:_Z3fooILi0EEvv
        movsx   rdi, edi
        movq    xmm0, rax
        mov     eax, OFFSET FLAT:_Z3fooILi2EEvv
        movhps  xmm0, QWORD PTR .LC0[rip]
        movaps  XMMWORD PTR [rsp-40], xmm0
        movq    xmm0, rax
        movhps  xmm0, QWORD PTR .LC1[rip]
        movaps  XMMWORD PTR [rsp-24], xmm0
        jmp     [QWORD PTR [rsp-40+rdi*8]]
.LC0:
        .quad   void foo<1>()
.LC1:
        .quad   void foo<3>()

这是因为GCC决定不将表存储在可执行文件的数据部分中,而是在每次函数运行时用其内容初始化一个局部变量。事实上,如果我们在这里删除constexpr,编译后的二进制文件是100%相同的。

这很容易比下面的代码慢10倍:

template <int N>
void foo();

void bar(int n)
{
    static constexpr void(*table[])(void) {
        &foo<0>,
        &foo<1>,
        &foo<2>,
        &foo<3>
    };
    table[n]();
}

我们唯一的改变是我们把表变成静态的,但是影响是巨大的:

bar(int):
        movsx   rdi, edi
        jmp     [QWORD PTR bar(int)::table[0+rdi*8]]
bar(int)::table:
        .quad   void foo<0>()
        .quad   void foo<1>()
        .quad   void foo<2>()
        .quad   void foo<3>()

总之,永远不要让您的查找表成为局部变量,即使它们是constexpr。Clang实际上很好地优化了此类查找表,但其他编译器做不到。有关现场示例,请参阅编译器资源管理器。

其他回答

不使大型数组静态,即使它们是constexpr,也会对性能产生巨大影响,并可能导致许多错过的优化。它可能会以数量级降低代码的速度。你的变量仍然是本地的,编译器可能决定在运行时初始化它们,而不是将它们作为数据存储在可执行文件中。

考虑下面的例子:

template <int N>
void foo();

void bar(int n)
{
    // array of four function pointers to void(void)
    constexpr void(*table[])(void) {
        &foo<0>,
        &foo<1>,
        &foo<2>,
        &foo<3>
    };
    // look up function pointer and call it
    table[n]();
}

你可能希望gcc-10 -O3将bar()编译为一个jmp,它从一个表中获取一个地址,但事实并非如此:

bar(int):
        mov     eax, OFFSET FLAT:_Z3fooILi0EEvv
        movsx   rdi, edi
        movq    xmm0, rax
        mov     eax, OFFSET FLAT:_Z3fooILi2EEvv
        movhps  xmm0, QWORD PTR .LC0[rip]
        movaps  XMMWORD PTR [rsp-40], xmm0
        movq    xmm0, rax
        movhps  xmm0, QWORD PTR .LC1[rip]
        movaps  XMMWORD PTR [rsp-24], xmm0
        jmp     [QWORD PTR [rsp-40+rdi*8]]
.LC0:
        .quad   void foo<1>()
.LC1:
        .quad   void foo<3>()

这是因为GCC决定不将表存储在可执行文件的数据部分中,而是在每次函数运行时用其内容初始化一个局部变量。事实上,如果我们在这里删除constexpr,编译后的二进制文件是100%相同的。

这很容易比下面的代码慢10倍:

template <int N>
void foo();

void bar(int n)
{
    static constexpr void(*table[])(void) {
        &foo<0>,
        &foo<1>,
        &foo<2>,
        &foo<3>
    };
    table[n]();
}

我们唯一的改变是我们把表变成静态的,但是影响是巨大的:

bar(int):
        movsx   rdi, edi
        jmp     [QWORD PTR bar(int)::table[0+rdi*8]]
bar(int)::table:
        .quad   void foo<0>()
        .quad   void foo<1>()
        .quad   void foo<2>()
        .quad   void foo<3>()

总之,永远不要让您的查找表成为局部变量,即使它们是constexpr。Clang实际上很好地优化了此类查找表,但其他编译器做不到。有关现场示例,请参阅编译器资源管理器。

除了给出的答案,值得注意的是,编译器不需要在编译时初始化constexpr变量,知道constexpr和静态constexpr之间的区别是,使用静态constexpr时,你要确保变量只初始化一次。

下面的代码演示了变量constexpr如何被初始化多次(尽管值相同),而静态constexpr肯定只初始化一次。

此外,代码还比较了constexpr与const结合static的优点。

#include <iostream>
#include <string>
#include <cassert>
#include <sstream>

const short const_short = 0;
constexpr short constexpr_short = 0;

// print only last 3 address value numbers
const short addr_offset = 3;

// This function will print name, value and address for given parameter
void print_properties(std::string ref_name, const short* param, short offset)
{
    // determine initial size of strings
    std::string title = "value \\ address of ";
    const size_t ref_size = ref_name.size();
    const size_t title_size = title.size();
    assert(title_size > ref_size);

    // create title (resize)
    title.append(ref_name);
    title.append(" is ");
    title.append(title_size - ref_size, ' ');

    // extract last 'offset' values from address
    std::stringstream addr;
    addr << param;
    const std::string addr_str = addr.str();
    const size_t addr_size = addr_str.size();
    assert(addr_size - offset > 0);

    // print title / ref value / address at offset
    std::cout << title << *param << " " << addr_str.substr(addr_size - offset) << std::endl;
}

// here we test initialization of const variable (runtime)
void const_value(const short counter)
{
    static short temp = const_short;
    const short const_var = ++temp;
    print_properties("const", &const_var, addr_offset);

    if (counter)
        const_value(counter - 1);
}

// here we test initialization of static variable (runtime)
void static_value(const short counter)
{
    static short temp = const_short;
    static short static_var = ++temp;
    print_properties("static", &static_var, addr_offset);

    if (counter)
        static_value(counter - 1);
}

// here we test initialization of static const variable (runtime)
void static_const_value(const short counter)
{
    static short temp = const_short;
    static const short static_var = ++temp;
    print_properties("static const", &static_var, addr_offset);

    if (counter)
        static_const_value(counter - 1);
}

// here we test initialization of constexpr variable (compile time)
void constexpr_value(const short counter)
{
    constexpr short constexpr_var = constexpr_short;
    print_properties("constexpr", &constexpr_var, addr_offset);

    if (counter)
        constexpr_value(counter - 1);
}

// here we test initialization of static constexpr variable (compile time)
void static_constexpr_value(const short counter)
{
    static constexpr short static_constexpr_var = constexpr_short;
    print_properties("static constexpr", &static_constexpr_var, addr_offset);

    if (counter)
        static_constexpr_value(counter - 1);
}

// final test call this method from main()
void test_static_const()
{
    constexpr short counter = 2;

    const_value(counter);
    std::cout << std::endl;

    static_value(counter);
    std::cout << std::endl;

    static_const_value(counter);
    std::cout << std::endl;

    constexpr_value(counter);
    std::cout << std::endl;

    static_constexpr_value(counter);
    std::cout << std::endl;
}

可能的程序输出:

value \ address of const is               1 564
value \ address of const is               2 3D4
value \ address of const is               3 244

value \ address of static is              1 C58
value \ address of static is              1 C58
value \ address of static is              1 C58

value \ address of static const is        1 C64
value \ address of static const is        1 C64
value \ address of static const is        1 C64

value \ address of constexpr is           0 564
value \ address of constexpr is           0 3D4
value \ address of constexpr is           0 244

value \ address of static constexpr is    0 EA0
value \ address of static constexpr is    0 EA0
value \ address of static constexpr is    0 EA0

正如你所看到的,constexpr被初始化多次(地址不相同),而static关键字确保初始化只执行一次。

简单的回答是,静态不仅有用,而且总是被需要的。

首先,请注意static和constexpr是完全相互独立的。Static定义了对象在执行期间的生命周期;Constexpr指定对象应该在编译期间可用。编译和执行在时间和空间上都是不连贯的。因此,一旦程序被编译,constexpr就不再相关了。

每个声明了constexpr的变量都是隐式const,但const和static几乎是正交的(除了与静态const整数的交互)。

The C++ object model (§1.9) requires that all objects other than bit-fields occupy at least one byte of memory and have addresses; furthermore all such objects observable in a program at a given moment must have distinct addresses (paragraph 6). This does not quite require the compiler to create a new array on the stack for every invocation of a function with a local non-static const array, because the compiler could take refuge in the as-if principle provided it can prove that no other such object can be observed.

不幸的是,这并不容易证明,除非函数很简单(例如,它不调用任何其他在转换单元中不可见的函数体),因为数组从定义上讲或多或少都是地址。因此,在大多数情况下,每次调用时都必须在堆栈上重新创建非静态const(expr)数组,这就无法在编译时计算它。

另一方面,局部静态const对象由所有观察者共享,并且即使定义它的函数从未被调用,也可以被初始化。所以以上都不适用,编译器不仅可以自由生成它的单个实例;可以在只读存储中生成它的单个实例。

所以你应该在你的例子中使用静态constexpr。

然而,有一种情况下您不希望使用静态constexpr。除非声明了constexpr的对象是odr使用的或声明为静态的,否则编译器完全可以不包含它。这非常有用,因为它允许使用编译时临时constexpr数组,而不会用不必要的字节污染已编译的程序。在这种情况下,显然不希望使用static,因为static可能会强制对象在运行时存在。