用自己的语言编写编译器

在之前的答案上增加好奇心。

这里引用了Linux from Scratch手册中的一段话，说明了从源代码开始构建GCC编译器的步骤。(Linux From Scratch是一种安装Linux的方式，它与安装发行版完全不同，因为你必须编译目标系统的每一个二进制文件。)

做引导 “bootstrap”目标不只是编译GCC，而是多次编译它。它使用在第一个编译的程序进行第二次编译，然后再次进行第三次。然后比较第二和第三个编译以确保它能够完美地复制自己。这也意味着它是正确编译的。

使用“bootstrap”目标的动机是，用于构建目标系统工具链的编译器可能与目标编译器的版本不完全相同。在目标系统中，以这种方式进行操作一定会获得一个可以编译自身的编译器。

在之前的答案上增加好奇心。

这里引用了Linux from Scratch手册中的一段话，说明了从源代码开始构建GCC编译器的步骤。(Linux From Scratch是一种安装Linux的方式，它与安装发行版完全不同，因为你必须编译目标系统的每一个二进制文件。)

做引导 “bootstrap”目标不只是编译GCC，而是多次编译它。它使用在第一个编译的程序进行第二次编译，然后再次进行第三次。然后比较第二和第三个编译以确保它能够完美地复制自己。这也意味着它是正确编译的。

使用“bootstrap”目标的动机是，用于构建目标系统工具链的编译器可能与目标编译器的版本不完全相同。在目标系统中，以这种方式进行操作一定会获得一个可以编译自身的编译器。

这是一个dump(实际上很难搜索的话题):

闲聊 C

这也是PyPy和Rubinius的想法:

(我想这也适用于Forth，但我对Forth一无所知。)

Mono项目的c#编译器已经“自托管”很长一段时间了，这意味着它是用c#本身编写的。

据我所知，编译器最初是纯C代码，但一旦实现了ECMA的“基本”特性，他们就开始用c#重写编译器。

我不知道用同一种语言编写编译器有什么好处，但我确信它至少与语言本身可以提供的特性有关(例如，C不支持面向对象编程)。

你可以在这里找到更多信息。

请注意，从技术上讲，您可以用一种仍然不存在的语言编写编译器。为了做到这一点，你创建了一个解释器，它是原始语言的一个下级，通常是缓慢和无用的，因为它在执行任何东西之前解释语言的每个语句。

如果你阅读它，它看起来确实完全像预期的语言，但它的执行要经过一些过程，将其转换为可执行的不止一个步骤。

这个编译器通常非常慢，因为它使用了一些适用于几乎所有现有语言的通用数学过程，但优点是下次除了在现有代码上使用生成的编译器外，什么也不用做。

当然这一次不需要解释。

你不能自己编写编译器，因为你没有任何东西来编译你的初始源代码。有两种方法可以解决这个问题。

最不受欢迎的是下面这些。你用汇编器(恶心)为语言的最小集合写一个最小的编译器，然后用那个编译器来实现语言的额外功能。逐步构建，直到拥有一个具有所有语言特性的编译器。这是一个痛苦的过程，通常只有在你别无选择的时候才会做。

首选的方法是使用交叉编译器。您可以在不同的机器上更改现有编译器的后端，以创建在目标机器上运行的输出。然后你就有了一个完美的完整编译器，并在目标机器上运行。这方面最流行的是C语言，因为现有的很多编译器都有可插拔的后端，可以进行交换。

一个鲜为人知的事实是，GNU c++编译器有一个只使用C子集的实现。原因是，通常很容易为新的目标机器找到一个C编译器，然后允许您从它构建完整的GNU c++编译器。现在，您已经在目标计算机上安装了c++编译器。

推荐文章