直观地说,Foo语言的编译器本身似乎不能用Foo来编写。更具体地说,Foo语言的第一个编译器不能用Foo编写,但任何后续的编译器都可以为Foo编写。
但这是真的吗?我隐约记得读过一种语言,它的第一个编译器是用“自身”编写的。这可能吗?如果可能,如何实现?
直观地说,Foo语言的编译器本身似乎不能用Foo来编写。更具体地说,Foo语言的第一个编译器不能用Foo编写,但任何后续的编译器都可以为Foo编写。
但这是真的吗?我隐约记得读过一种语言,它的第一个编译器是用“自身”编写的。这可能吗?如果可能,如何实现?
当前回答
GNAT是GNU Ada编译器,需要完全构建Ada编译器。当将其移植到一个没有现成的GNAT二进制文件的平台时,这可能是一个麻烦。
其他回答
在之前的答案上增加好奇心。
这里引用了Linux from Scratch手册中的一段话,说明了从源代码开始构建GCC编译器的步骤。(Linux From Scratch是一种安装Linux的方式,它与安装发行版完全不同,因为你必须编译目标系统的每一个二进制文件。)
做引导 “bootstrap”目标不只是编译GCC,而是多次编译它。它使用在第一个编译的程序 进行第二次编译,然后再次进行第三次。然后比较第二和第三个 编译以确保它能够完美地复制自己。这也意味着它是正确编译的。
使用“bootstrap”目标的动机是,用于构建目标系统工具链的编译器可能与目标编译器的版本不完全相同。在目标系统中,以这种方式进行操作一定会获得一个可以编译自身的编译器。
这是一个dump(实际上很难搜索的话题):
闲聊 C
这也是PyPy和Rubinius的想法:
(我想这也适用于Forth,但我对Forth一无所知。)
请注意,从技术上讲,您可以用一种仍然不存在的语言编写编译器。为了做到这一点,你创建了一个解释器,它是原始语言的一个下级,通常是缓慢和无用的,因为它在执行任何东西之前解释语言的每个语句。
如果你阅读它,它看起来确实完全像预期的语言,但它的执行要经过一些过程,将其转换为可执行的不止一个步骤。
这个编译器通常非常慢,因为它使用了一些适用于几乎所有现有语言的通用数学过程,但优点是下次除了在现有代码上使用生成的编译器外,什么也不用做。
当然这一次不需要解释。
GNAT是GNU Ada编译器,需要完全构建Ada编译器。当将其移植到一个没有现成的GNAT二进制文件的平台时,这可能是一个麻烦。
是的,你可以用一种语言编写编译器。不,你不需要第一个编译器来引导该语言。
您需要引导的是该语言的实现。它可以是编译器,也可以是解释器。
历史上,语言通常被认为是解释语言或编译语言。解释器只为前者编写,编译器只为后者编写。所以通常,如果要为一种语言编写编译器,第一个编译器会用其他语言编写以引导它,然后,可选地,编译器会为主题语言重新编写。但是用另一种语言编写解释器也是一种选择。
这不仅仅是理论上的。我自己也在做这件事。我正在为自己开发的语言Salmon编写编译器。我首先用C创建了一个Salmon编译器,现在我正在用Salmon编写编译器,所以我可以让Salmon编译器工作,而不需要用任何其他语言为Salmon编写编译器。