如何评测在Linux上运行的C++代码？

这是我用来加速代码的两种方法：

对于CPU绑定的应用程序：

在DEBUG模式下使用探查器来识别代码中有问题的部分然后切换到RELEASE模式，注释掉代码中有问题的部分（不加任何内容），直到看到性能的变化。

对于I/O绑定应用程序：

在RELEASE模式下使用探查器来识别代码中有问题的部分。

N.B.

如果你没有剖析器，就用穷人的剖析器。调试应用程序时单击暂停。大多数开发人员套件将使用注释的行号分解成程序集。从统计上看，你很可能会在一个消耗了大部分CPU周期的区域着陆。

对于CPU来说，在DEBUG模式下进行评测的原因是，如果您尝试在RELEASE模式下进行剖析，编译器将减少数学、矢量化循环和内联函数，这些函数在汇编代码时会使代码陷入无法映射的混乱。无法映射的混乱意味着您的探查器将无法清楚地识别所需的时间，因为程序集可能与正在优化的源代码不符。如果您需要RELEASE模式的性能（例如，对时间敏感），请根据需要禁用调试器功能以保持可用的性能。

对于I/O绑定，探查器仍然可以在RELEASE模式下识别I/O操作，因为I/O操作要么在外部链接到共享库（大多数情况下），要么在最坏的情况下会导致系统调用中断向量（探查器也很容易识别）。

2013-11-28 18:21:44

对于单线程程序，您可以使用igprof，The Ignorminous Profiler：https://igprof.org/ .

这是一个采样分析器，沿着。。。长的Mike Dunlavey的回答，它将把结果包装在一个可浏览的调用堆栈树中，用每个函数（无论是累积的还是每个函数）花费的时间或内存进行注释。

2018-03-17 12:20:45

使用Valgrind、callgrind和kcachegrind：

valgrind --tool=callgrind ./(Your binary)

生成callgrind.out.x。使用kcachegrind读取它。

使用gprof（add-pg）：

cc -o myprog myprog.c utils.c -g -pg

（对于多线程、函数指针不太好）

使用google perftools：

使用时间采样，可以发现I/O和CPU瓶颈。

英特尔VTune是最好的（出于教育目的免费）。

其他：AMD Codeanalysis（已被AMD CodeXL取代）、OProfile、“perf”工具（apt-get-install-linux工具）

2017-02-23 21:28:10

这是我用来加速代码的两种方法：

对于CPU绑定的应用程序：

在DEBUG模式下使用探查器来识别代码中有问题的部分然后切换到RELEASE模式，注释掉代码中有问题的部分（不加任何内容），直到看到性能的变化。

对于I/O绑定应用程序：

在RELEASE模式下使用探查器来识别代码中有问题的部分。

N.B.

如果你没有剖析器，就用穷人的剖析器。调试应用程序时单击暂停。大多数开发人员套件将使用注释的行号分解成程序集。从统计上看，你很可能会在一个消耗了大部分CPU周期的区域着陆。

对于CPU来说，在DEBUG模式下进行评测的原因是，如果您尝试在RELEASE模式下进行剖析，编译器将减少数学、矢量化循环和内联函数，这些函数在汇编代码时会使代码陷入无法映射的混乱。无法映射的混乱意味着您的探查器将无法清楚地识别所需的时间，因为程序集可能与正在优化的源代码不符。如果您需要RELEASE模式的性能（例如，对时间敏感），请根据需要禁用调试器功能以保持可用的性能。

对于I/O绑定，探查器仍然可以在RELEASE模式下识别I/O操作，因为I/O操作要么在外部链接到共享库（大多数情况下），要么在最坏的情况下会导致系统调用中断向量（探查器也很容易识别）。

2013-11-28 18:21:44

在工作中，我们有一个非常好的工具，它可以帮助我们监控我们想要的日程安排。这已多次有用。

它是用C++编写的，必须根据您的需要进行定制。不幸的是，我不能共享代码，只有概念。您使用一个包含时间戳和事件ID的“大”易失性缓冲区，可以在死后或停止日志系统后转储（例如，将其转储到文件中）。

您检索包含所有数据的所谓大缓冲区，一个小接口解析它并显示带有名称（up/down+value）的事件，就像示波器使用颜色（在.hpp文件中配置）所做的那样。

您可以自定义生成的事件数量，以仅关注您所需的内容。它帮助我们解决了调度问题，同时根据每秒记录的事件数量消耗了所需的CPU数量。

您需要3个文件：

toolname.hpp // interface
toolname.cpp // code
tool_events_id.hpp // Events ID

其概念是在tool_events_id.hpp中定义如下事件：

// EVENT_NAME                         ID      BEGIN_END BG_COLOR NAME
#define SOCK_PDU_RECV_D               0x0301  //@D00301 BGEEAAAA # TX_PDU_Recv
#define SOCK_PDU_RECV_F               0x0302  //@F00301 BGEEAAAA # TX_PDU_Recv

您还可以在toolname.hpp中定义一些函数：

#define LOG_LEVEL_ERROR 0
#define LOG_LEVEL_WARN 1
// ...

void init(void);
void probe(id,payload);
// etc

代码中可以使用的任何位置：

toolname<LOG_LEVEL>::log(EVENT_NAME,VALUE);

probe函数使用几条装配线尽快检索时钟时间戳，然后在缓冲区中设置一个条目。我们还有一个原子增量来安全地找到存储日志事件的索引。当然，缓冲区是圆形的。

希望这个想法不会因为缺少示例代码而混淆。

2019-05-17 10:13:01

编译和链接代码并运行可执行文件时，请使用-pg标志。执行此程序时，分析数据收集在文件a.out中。有两种不同类型的分析

1-平面轮廓：通过运行命令gprog--flat profile a.out，可以获得以下数据-该功能所花费的总时间的百分比，-在包括和排除对子函数的调用的函数中花费了多少秒，-呼叫的数量，-每次通话的平均时间。

2-图形分析使用命令gprof--graph a.out获取每个函数的以下数据，其中包括-在每个部分中，一个函数都标有索引编号。-在函数上方，有一个调用该函数的函数列表。-在函数下面，有一个函数调用的函数列表。

要获取更多信息，请查看https://sourceware.org/binutils/docs-2.32/gprof/

2019-12-07 12:52:42

如何评测在Linux上运行的C++代码？

推荐文章

最新文章

标签