进程和线程之间的技术区别是什么?

我感觉像“进程”这样的词被过度使用了,而且还有硬件和软件线程。像Erlang这样的语言中的轻量级进程怎么样?是否有明确的理由使用一个术语而不是另一个术语?


当前回答

每个进程都是一个线程(主线程)。但每个线程都不是一个进程。它是流程的一部分(实体)。

其他回答

在用Python(解释语言)构建包含多线程的算法时,我惊讶地发现,与我之前构建的顺序算法相比,执行时间并没有任何改善。为了理解导致这种结果的原因,我做了一些阅读,并相信我所学到的内容提供了一个有趣的背景,可以更好地理解多线程和多进程之间的差异。

多核系统可能会执行多个线程,因此Python应该支持多线程。但Python不是一种编译语言,而是一种解释语言1。这意味着必须对程序进行解释才能运行,并且在程序开始执行之前,解释器不知道程序。然而,它所知道的是Python的规则,然后动态地应用这些规则。Python中的优化必须主要是解释器本身的优化,而不是要运行的代码。这与C++等编译语言形成对比,并对Python中的多线程产生影响。具体来说,Python使用全局解释器锁来管理多线程。

另一方面,编译语言是编译的。程序被“完全”处理,首先根据其语法定义进行解释,然后映射到语言不可知的中间表示,最后链接到可执行代码中。这个过程允许代码得到高度优化,因为在编译时所有代码都可用。在创建可执行文件时定义了各种程序交互和关系,可以做出关于优化的稳健决策。

在现代环境中,Python的解释器必须允许多线程,这必须既安全又高效。这就是解释语言与编译语言的区别所在。解释器必须不干扰来自不同线程的内部共享数据,同时优化处理器的计算使用。

如前几篇文章所述,进程和线程都是独立的顺序执行,主要区别在于内存在进程的多个线程之间共享,而进程隔离了它们的内存空间。

在Python中,全局解释器锁防止不同线程同时访问数据。它要求在任何Python程序中,任何时候只能执行一个线程。另一方面,可以运行多个进程,因为每个进程的内存都与任何其他进程隔离,并且进程可以在多个内核上运行。


唐纳德·克努思在《计算机编程的艺术:基本算法》中对解释例程有很好的解释。

来自嵌入式世界,我想补充一点,进程的概念只存在于具有MMU(内存管理单元)的“大型”处理器(台式CPU、ARM Cortex A-9)和支持使用MMU的操作系统(如Linux)中。对于小型/老式处理器和微控制器以及小型RTOS操作系统(实时操作系统),如freeRTOS,没有MMU支持,因此没有进程,只有线程。

线程可以访问彼此的内存,并且它们由OS以交错的方式调度,因此它们看起来是并行运行的(或者对于多核线程,它们实际上是并行运行)。

另一方面,进程则生活在由MMU提供和保护的私有虚拟内存沙盒中。这很方便,因为它可以:

防止错误进程导致整个系统崩溃。通过使其他流程数据不可见和无法访问。进程内的实际工作由一个或多个线程负责。

线程和进程都是OS资源分配的原子单元(即,有一个并发模型描述了CPU时间如何在它们之间分配,以及拥有其他OS资源的模型)。不同之处在于:

共享资源(根据定义,线程共享内存,除了堆栈和本地变量之外,它们不拥有任何东西;进程也可以共享内存,但这有一个单独的机制,由OS维护)分配空间(进程的内核空间与线程的用户空间)

格雷格·休吉尔(Greg Hewgill)对“进程”一词的Erlang含义是正确的,这里讨论了为什么Erlang可以实现轻量级进程。

对于那些更喜欢通过可视化学习的人来说,这里是我创建的一个方便的图表,用于解释流程和线程。我使用了MSDN中的信息-关于进程和线程

进程是代码、内存、数据和其他资源的集合。线程是在进程范围内执行的一系列代码。您可以(通常)在同一进程中同时执行多个线程。