也许我不是来自这个星球,但在我看来,以下应该是一个语法错误:
int a[] = {1,2,}; //extra comma in the end
但事实并非如此。当这段代码在Visual Studio上编译时,我很惊讶,但我已经学会了不相信MSVC编译器,就c++规则而言,所以我检查了标准,它也是标准允许的。如果你不相信的话,语法规则可以参考8.5.1。
Why is this allowed? This may be a stupid useless question but I want you to understand why I am asking. If it were a sub-case of a general grammar rule, I would understand - they decided not to make the general grammar any more difficult just to disallow a redundant comma at the end of an initializer list. But no, the additional comma is explicitly allowed. For example, it isn't allowed to have a redundant comma in the end of a function-call argument list (when the function takes ...), which is normal.
那么,有什么特别的原因,这个多余的逗号是明确允许的吗?
它使得生成数组或枚举的代码生成器更容易。
想象一下:
std::cout << "enum Items {\n";
for(Items::iterator i(items.begin()), j(items.end); i != j; ++i)
std::cout << *i << ",\n";
std::cout << "};\n";
也就是说,不需要对第一项或最后一项进行特殊处理,以避免出现尾随逗号。
例如,如果代码生成器是用Python编写的,使用str.join()函数可以很容易地避免吐出尾随逗号:
print("enum Items {")
print(",\n".join(items))
print("}")
我很惊讶这么长时间以来没有人引用注解c++参考手册(ARM),它是这样描述[dcl. C]的。我的:
用于初始化的表示法显然太多了,但每种表示法似乎都适用于特定的使用风格。={initializer_list,opt}符号继承自C语言,可以很好地初始化数据结构和数组。[…]
尽管自ARM诞生以来语法一直在发展,但起源仍然存在。
我们可以查看C99的基本原理,看看为什么在C中允许这样做,它说:
类的初始化式中允许有一个尾随逗号
初始化器列表。标准保留了这个语法,因为它
提供从初始化式中添加或删除成员的灵活性
列表,并简化了此类列表的机器生成。
像许多东西一样,数组初始化器中的尾随逗号是c++从C继承的东西之一(并且必须永远支持)。在《Deep C secrets》一书中提到了与此完全不同的观点。
在一个有多个“逗号悖论”的例子之后:
char *available_resources[] = {
"color monitor" ,
"big disk" ,
"Cray" /* whoa! no comma! */
"on-line drawing routines",
"mouse" ,
"keyboard" ,
"power cables" , /* and what's this extra comma? */
};
我们读到:
...最后一个初始化式后面的逗号不是一个拼写错误,而是从原始c中继承下来的语法中的一个小点。它的存在或不存在是允许的,但没有任何意义。在ANSI C基本原理中声称的理由是,它使C的自动生成更容易。如果允许在每个以逗号分隔的列表中使用尾随逗号,例如在枚举声明中,或在单个声明中使用多个变量声明器,则声明将更加可信。事实并非如此。
... 对我来说,这更有意义
这样可以防止在长列表中移动元素导致的错误。
例如,让我们假设我们有一个这样的代码。
#include <iostream>
#include <string>
#include <cstddef>
#define ARRAY_SIZE(array) (sizeof(array) / sizeof *(array))
int main() {
std::string messages[] = {
"Stack Overflow",
"Super User",
"Server Fault"
};
size_t i;
for (i = 0; i < ARRAY_SIZE(messages); i++) {
std::cout << messages[i] << std::endl;
}
}
它很棒,因为它展示了Stack Exchange网站的原始三部曲。
Stack Overflow
Super User
Server Fault
但它有一个问题。你看,这个网站的页脚在超级用户之前显示了服务器故障。最好在别人发现之前搞定。
#include <iostream>
#include <string>
#include <cstddef>
#define ARRAY_SIZE(array) (sizeof(array) / sizeof *(array))
int main() {
std::string messages[] = {
"Stack Overflow",
"Server Fault"
"Super User",
};
size_t i;
for (i = 0; i < ARRAY_SIZE(messages); i++) {
std::cout << messages[i] << std::endl;
}
}
毕竟,移动线条并没有那么难,不是吗?
Stack Overflow
Server FaultSuper User
我知道,没有网站称为“服务器故障超级用户”,但我们的编译器声称它存在。现在,问题是C有一个字符串连接特性,它允许您编写两个双引号字符串并不使用任何东西将它们连接起来(类似的问题也会发生在整数上,因为- sign有多个含义)。
现在,如果原始数组的末尾有一个无用的逗号呢?线会移动,但这样的bug不会发生。像逗号这么小的东西很容易被漏掉。如果你记得在每个数组元素后面加一个逗号,这样的错误就不会发生。您不希望浪费4个小时调试某个东西,直到您发现逗号是问题的原因。