c++是上下文无关的还是上下文敏感的?

我经常听到有人说c++是一种上下文敏感的语言。举个例子:

a b(c);

这是变量定义还是函数声明?这取决于符号c的含义。如果c是一个变量，则ab (c);定义一个名为b的类型为a的变量。它直接用c初始化。但如果c是类型，则ab (c);声明一个名为b的函数，该函数接受c并返回a。

如果您查找上下文无关语言的定义，它基本上会告诉您，所有语法规则的左侧必须恰好包含一个非终结符。另一方面，上下文敏感语法允许在左侧使用任意的终结符和非终结符字符串。

浏览“c++程序设计语言”的附录A，我找不到一条语法规则，它的左边除了一个非终结符之外，还有其他任何东西。这意味着c++是上下文无关的。(当然，每一种与上下文无关的语言也是与上下文相关的，因为与上下文无关的语言构成了与上下文相关的语言的一个子集，但这不是重点。)

那么，c++是上下文无关的还是上下文敏感的?

当前回答

是的，c++是上下文敏感的，非常上下文敏感。您不能通过使用上下文无关的解析器简单地解析文件来构建语法树，因为在某些情况下，您需要从以前的知识中了解符号来决定(例如。在解析时构建一个符号表)。

第一个例子:

A*B;

这是一个乘法表达式吗?

这是B变量作为a类型指针的声明吗?

如果A是一个变量，那么它就是一个表达式，如果A是类型，它就是一个指针声明。

第二个例子:

A B(bar);

这是一个函数原型接受一个条形参数吗?

这是声明A类型的变量B，并调用A的构造函数和bar常量作为初始化式吗?

您需要再次了解bar是符号表中的变量还是类型。

第三个例子:

class Foo
{
public:
    void fn(){x*y;}
    int x, y;
};

当解析时构建符号表没有帮助时，就是这种情况，因为x和y的声明在函数定义之后。因此，您需要首先浏览类定义，然后在第二步查看方法定义，以确定x*y是一个表达式，而不是指针声明或其他东西。

其他回答

要回答你的问题，你需要区分两个不同的问题。

几乎每一种编程语言的语法都与上下文无关。通常，它是作为扩展的Backus-Naur形式或上下文无关语法给出的。然而，即使一个程序符合编程语言定义的上下文无关语法，它也不一定是一个有效的程序。为了成为一个有效的程序，程序必须满足许多与上下文无关的属性。例如，最简单的属性是变量的作用域。

综上所述，c++是否与上下文无关取决于你问的问题。

有时情况更糟:当人们说c++具有“不可判定语法”时，他们的意思是什么?

你可能想看看Bjarne Stroustrup写的《c++的设计与进化》。在这篇文章中，他描述了他在尝试使用yacc(或类似的)来解析早期版本的c++时遇到的问题，并希望他当时使用的是递归下降。

我感觉在“上下文敏感”的正式定义和“上下文敏感”的非正式使用之间存在一些混淆。前者有明确的含义。后者用于表示“为了解析输入，您需要上下文”。

这里也有一个问题: 上下文敏感性vs模糊性。

这是一个与上下文无关的语法:

<a> ::= <b> | <c>
<b> ::= "x"
<c> ::= "x"

它是模棱两可的，所以为了解析输入“x”，你需要一些上下文(或者忍受这种模棱两可，或者发出“警告:E8271 - input is ambiguous in line 115”)。但它肯定不是上下文敏感的语法。

没有一种类algol语言是与上下文无关的，因为它们有规则约束表达式和语句，标识符可以根据它们的类型出现在这些表达式和语句中，并且因为在声明和使用之间可以出现的语句数量没有限制。

通常的解决方案是编写一个上下文无关的解析器，它实际上接受有效程序的超集，并将上下文敏感的部分放在附加到规则的特殊“语义”代码中。

c++的图灵完备模板系统远远超越了这一点。参见堆栈溢出问题794015。

推荐文章