也许我不是来自这个星球,但在我看来,以下应该是一个语法错误:
int a[] = {1,2,}; //extra comma in the end
但事实并非如此。当这段代码在Visual Studio上编译时,我很惊讶,但我已经学会了不相信MSVC编译器,就c++规则而言,所以我检查了标准,它也是标准允许的。如果你不相信的话,语法规则可以参考8.5.1。
Why is this allowed? This may be a stupid useless question but I want you to understand why I am asking. If it were a sub-case of a general grammar rule, I would understand - they decided not to make the general grammar any more difficult just to disallow a redundant comma at the end of an initializer list. But no, the additional comma is explicitly allowed. For example, it isn't allowed to have a redundant comma in the end of a function-call argument list (when the function takes ...), which is normal.
那么,有什么特别的原因,这个多余的逗号是明确允许的吗?
我很惊讶这么长时间以来没有人引用注解c++参考手册(ARM),它是这样描述[dcl. C]的。我的:
用于初始化的表示法显然太多了,但每种表示法似乎都适用于特定的使用风格。={initializer_list,opt}符号继承自C语言,可以很好地初始化数据结构和数组。[…]
尽管自ARM诞生以来语法一直在发展,但起源仍然存在。
我们可以查看C99的基本原理,看看为什么在C中允许这样做,它说:
类的初始化式中允许有一个尾随逗号
初始化器列表。标准保留了这个语法,因为它
提供从初始化式中添加或删除成员的灵活性
列表,并简化了此类列表的机器生成。
它使生成源代码变得更容易,也使编写日后可以轻松扩展的代码变得更容易。考虑一下添加额外条目需要什么:
int a[] = {
1,
2,
3
};
... 您必须在现有行中添加逗号,并添加新行。与“3”后面已经有逗号的情况相比,你只需要添加一行。同样地,如果你想删除一行,你可以不用担心它是否是最后一行,你可以重新排序而不用用逗号。基本上,这意味着你对待线条的方式是一致的。
现在考虑生成代码。类似(伪代码):
output("int a[] = {");
for (int i = 0; i < items.length; i++) {
output("%s, ", items[i]);
}
output("};");
不需要担心您正在输出的当前项是第一个还是最后一个。更加简单。
我很惊讶这么长时间以来没有人引用注解c++参考手册(ARM),它是这样描述[dcl. C]的。我的:
用于初始化的表示法显然太多了,但每种表示法似乎都适用于特定的使用风格。={initializer_list,opt}符号继承自C语言,可以很好地初始化数据结构和数组。[…]
尽管自ARM诞生以来语法一直在发展,但起源仍然存在。
我们可以查看C99的基本原理,看看为什么在C中允许这样做,它说:
类的初始化式中允许有一个尾随逗号
初始化器列表。标准保留了这个语法,因为它
提供从初始化式中添加或删除成员的灵活性
列表,并简化了此类列表的机器生成。
这样可以防止在长列表中移动元素导致的错误。
例如,让我们假设我们有一个这样的代码。
#include <iostream>
#include <string>
#include <cstddef>
#define ARRAY_SIZE(array) (sizeof(array) / sizeof *(array))
int main() {
std::string messages[] = {
"Stack Overflow",
"Super User",
"Server Fault"
};
size_t i;
for (i = 0; i < ARRAY_SIZE(messages); i++) {
std::cout << messages[i] << std::endl;
}
}
它很棒,因为它展示了Stack Exchange网站的原始三部曲。
Stack Overflow
Super User
Server Fault
但它有一个问题。你看,这个网站的页脚在超级用户之前显示了服务器故障。最好在别人发现之前搞定。
#include <iostream>
#include <string>
#include <cstddef>
#define ARRAY_SIZE(array) (sizeof(array) / sizeof *(array))
int main() {
std::string messages[] = {
"Stack Overflow",
"Server Fault"
"Super User",
};
size_t i;
for (i = 0; i < ARRAY_SIZE(messages); i++) {
std::cout << messages[i] << std::endl;
}
}
毕竟,移动线条并没有那么难,不是吗?
Stack Overflow
Server FaultSuper User
我知道,没有网站称为“服务器故障超级用户”,但我们的编译器声称它存在。现在,问题是C有一个字符串连接特性,它允许您编写两个双引号字符串并不使用任何东西将它们连接起来(类似的问题也会发生在整数上,因为- sign有多个含义)。
现在,如果原始数组的末尾有一个无用的逗号呢?线会移动,但这样的bug不会发生。像逗号这么小的东西很容易被漏掉。如果你记得在每个数组元素后面加一个逗号,这样的错误就不会发生。您不希望浪费4个小时调试某个东西,直到您发现逗号是问题的原因。
像许多东西一样,数组初始化器中的尾随逗号是c++从C继承的东西之一(并且必须永远支持)。在《Deep C secrets》一书中提到了与此完全不同的观点。
在一个有多个“逗号悖论”的例子之后:
char *available_resources[] = {
"color monitor" ,
"big disk" ,
"Cray" /* whoa! no comma! */
"on-line drawing routines",
"mouse" ,
"keyboard" ,
"power cables" , /* and what's this extra comma? */
};
我们读到:
...最后一个初始化式后面的逗号不是一个拼写错误,而是从原始c中继承下来的语法中的一个小点。它的存在或不存在是允许的,但没有任何意义。在ANSI C基本原理中声称的理由是,它使C的自动生成更容易。如果允许在每个以逗号分隔的列表中使用尾随逗号,例如在枚举声明中,或在单个声明中使用多个变量声明器,则声明将更加可信。事实并非如此。
... 对我来说,这更有意义