每个核心的最佳线程数

假设我有一个4核CPU，我想在最短的时间内运行某个进程。这个过程在理想情况下是可并行的，所以我可以在无数个线程上运行它的块，每个线程花费相同的时间。

因为我有4个内核，所以我不期望通过运行比内核更多的线程来提高速度，因为单个内核在给定时刻只能运行单个线程。我对硬件了解不多，所以这只是一个猜测。

在更多的线程而不是核心上运行并行进程是否有好处?换句话说，如果我使用4000个线程而不是4个线程运行，我的进程会更快、更慢，还是在大约相同的时间内完成?

当前回答

基准。

我会开始增加应用程序的线程数，从1开始，然后增加到100，对每个线程数运行3 - 5次试验，并建立一个操作速度与线程数的关系图。

您应该认为四个线程的情况是最优的，在此之后运行时略有增加，但也可能不是。这可能是你的应用程序带宽有限，也就是说，你加载到内存中的数据集是巨大的，你得到了很多缓存失误，等等，这样2个线程是最佳的。

你不测试就不知道。

2009-11-11 22:46:55

其他回答

通过运行htop或ps命令(返回机器上的进程数)，您将发现可以在机器上运行多少个线程。

您可以使用手册页关于'ps'命令。

man ps

如果你想计算所有用户进程的数量，你可以使用这些命令之一:

Ps -aux| wc -l ps -eLf | wc -l

计算用户进程数:

ps—root用户| wc -l

此外，你还可以使用“htop”[参考]:

在Ubuntu或Debian上安装:

sudo apt-get install htop

在Redhat或CentOS上安装:

yum install htop
dnf install htop      [On Fedora 22+ releases]

如果您想从源代码编译htop，可以在这里找到它。

2017-10-23 08:31:34

我同意@Gonzalo的回答。我有一个不做I/O的进程，下面是我的发现:

请注意，所有线程都工作在一个数组上，但范围不同(两个线程不访问相同的索引)，因此如果它们工作在不同的数组上，结果可能会有所不同。

这台1.86版本的机器是一台带有SSD的macbook air。另一台mac是一台iMac，硬盘正常(我想转速是7200转)。这台装有windows操作系统的机器还有一个7200转的硬盘。

在这个测试中，最佳的数量等于机器中的核数。

2012-05-20 02:55:45

大量线程(“线程池”)vs每个核心一个线程的一个例子是在Linux或Windows中实现web服务器。

由于在Linux中套接字是轮询的，因此许多线程可能会增加其中一个线程在正确的时间轮询正确的套接字的可能性——但总体处理成本将非常高。

在Windows中，服务器将使用I/O完成端口(IOCPs)实现，这将使应用程序事件驱动:如果I/O完成，操作系统将启动一个备用线程来处理它。当处理完成时(通常是请求-响应对中的另一个I/O操作)，线程返回IOCP端口(队列)等待下一次完成。

如果没有I/O完成，就没有要做的处理，也没有启动线程。

事实上，微软建议在IOCP实现中每个核不超过一个线程。任何I/O都可以附加到IOCP机制。如果需要，应用程序也可以发布IOCs。

2012-02-13 17:44:39

理想的情况是每个内核有一个线程，只要没有线程会阻塞。

在一种情况下，这可能是不正确的:有其他线程在核心上运行，在这种情况下，更多的线程可能会给您的程序更大的执行时间。

2009-11-11 22:23:33

一次4000个线程是相当高的。

答案是肯定的，也不是。如果您在每个线程中执行大量阻塞I/O，那么是的，您可以在每个逻辑核心中执行3或4个线程时显示显著的加速。

If you are not doing a lot of blocking things however, then the extra overhead with threading will just make it slower. So use a profiler and see where the bottlenecks are in each possibly parallel piece. If you are doing heavy computations, then more than 1 thread per CPU won't help. If you are doing a lot of memory transfer, it won't help either. If you are doing a lot of I/O though such as for disk access or internet access, then yes multiple threads will help up to a certain extent, or at the least make the application more responsive.

2009-11-11 22:32:32

每个核心的最佳线程数

推荐文章

最新文章

标签