Linux中的线程与进程

最近我听到一些人说，在Linux中，使用进程几乎总是比使用线程更好，因为Linux在处理进程方面非常高效，而且与线程相关的问题太多了(比如锁)。然而，我对此持怀疑态度，因为在某些情况下，线程似乎可以带来相当大的性能提升。

因此，我的问题是，当遇到线程和进程都可以很好地处理的情况时，我应该使用进程还是线程?例如，如果我正在编写一个web服务器，我应该使用进程还是线程(或组合)?

当前回答

我不得不同意你所听到的。当我们对我们的集群(xhpl等)进行基准测试时，我们总是通过进程而不是线程获得明显更好的性能。< /轶事>

2009-04-30 15:37:35

其他回答

这取决于很多因素。进程比线程更重，启动和关闭成本更高。进程间通信(IPC)也比线程间通信更困难、更慢。

相反，进程比线程更安全，因为每个进程都运行在自己的虚拟地址空间中。如果一个进程崩溃或缓冲区溢出，它根本不会影响任何其他进程，而如果一个线程崩溃，它会关闭进程中的所有其他线程，如果一个线程缓冲区溢出，它会在所有线程中打开一个安全漏洞。

因此，如果应用程序的模块可以在很少通信的情况下独立运行，那么如果能够负担得起启动和关闭成本，则可能应该使用进程。IPC对性能的影响将是最小的，并且您在漏洞和安全漏洞方面会稍微安全一些。如果您需要获得或拥有大量共享数据(例如复杂的数据结构)，那么请使用线程。

2009-04-30 15:37:58

线程/进程之间的决定取决于您将使用它来做什么。进程的好处之一是它有一个PID，可以在不终止父进程的情况下被杀死。

对于一个真实世界的web服务器的例子，apache 1.3过去只支持多进程，但是在2.0中他们增加了一个抽象，这样你就可以在两者之间切换。评论似乎同意进程更健壮，但线程可以提供更好的性能(除了那些进程性能很差且您只想使用线程的窗口)。

2009-04-30 16:04:52

更复杂的是，还有线程本地存储和Unix共享内存。

Thread-local storage allows each thread to have a separate instance of global objects. The only time I've used it was when constructing an emulation environment on linux/windows, for application code that ran in an RTOS. In the RTOS each task was a process with it's own address space, in the emulation environment, each task was a thread (with a shared address space). By using TLS for things like singletons, we were able to have a separate instance for each thread, just like under the 'real' RTOS environment.

共享内存(显然)可以为您带来让多个进程访问相同内存的性能优势，但代价是必须正确地同步进程。一种方法是让一个进程在共享内存中创建一个数据结构，然后通过传统的进程间通信(如命名管道)向该结构发送句柄。

2009-04-30 21:33:37

其他人讨论了这些考虑因素。

也许重要的区别是，在Windows中，与线程相比，进程是沉重和昂贵的，而在Linux中，差异要小得多，所以等式在不同的点上平衡。

2009-04-30 17:50:04

Linux使用1-1线程模型，(对内核来说)没有进程和线程的区别——一切都只是一个可运行的任务。＊

在Linux上，系统调用clone克隆一个任务，共享级别可配置，其中包括:

CLONE_FILES:共享相同的文件描述符表(而不是创建一个副本) CLONE_PARENT:不要在新任务和旧任务之间建立父子关系(否则，child的getppid() = parent的getpid()) CLONE_VM:共享相同的内存空间(而不是创建COW副本)

Fork()调用clone(共享最少)，pthread_create()调用clone(共享最多)。**

fork的成本比pthread_creation略高，因为需要复制表并为内存创建COW映射，但是Linux内核开发人员已经尝试(并成功)将这些成本最小化。

如果任务共享相同的内存空间和不同的表，那么它们之间的切换将比不共享的任务稍微便宜一些，因为数据可能已经加载到缓存中了。然而，即使没有任何共享，切换任务仍然非常快——这是Linux内核开发人员试图确保(并成功确保)的另一件事。

事实上，如果您在多处理器系统上，不共享实际上可能有利于性能:如果每个任务都在不同的处理器上运行，同步共享内存的成本很高。

*简化。CLONE_THREAD导致信号传递被共享(这需要共享信号处理程序表的CLONE_SIGHAND)。

* *简化。SYS_fork和SYS_clone系统调用都存在，但是在内核中，SYS_fork和SYS_clone都是对同一个do_fork函数的非常薄的包装，而do_fork函数本身也是对copy_process的薄包装。是的，进程、线程和任务这三个术语在Linux内核中是可以互换使用的……

2009-04-30 20:59:49

Linux中的线程与进程

推荐文章

最新文章

标签