我如何知道代码中的哪些部分从未使用过?

我有遗留的c++代码，我应该删除不使用的代码。问题是代码库很大。

我如何才能知道哪些代码从未被调用/从未被使用?

当前回答

我有个朋友今天问了我这个问题，我看了看一些有前途的Clang开发，例如ASTMatchers和Static Analyzer，它们可能在编译过程中有足够的可见性来确定死代码部分，但后来我发现了这个:

https://blog.flameeyes.eu/2008/01/today-how-to-identify-unused-exported-functions-and-variables

它几乎完整地描述了如何使用一些GCC标志，这些标志似乎是为了识别未引用的符号而设计的!

2013-07-11 03:43:00

其他回答

有两种未使用的代码:

局部路径，即在某些函数中，某些路径或变量未使用(或使用但没有任何意义，如写入但从未读取) 全局的:永远不会调用的函数，永远不会访问的全局对象

对于第一种类型，一个好的编译器可以帮助:

-Wunused (GCC, Clang)应该警告未使用的变量，Clang未使用的分析器甚至已经增加到警告从未读取的变量(即使使用)。 -Wunreachable-code(旧的GCC，在2010年被移除)应该警告从未被访问的局部块(它发生在早期返回或条件总是计算为true时) 据我所知，没有选项可以警告未使用的catch块，因为编译器通常不能证明没有异常将被抛出。

对于第二种，要困难得多。静态地，它需要整个程序的分析，即使链接时间优化实际上可以删除死代码，在实践中，程序在执行时已经进行了如此多的转换，以至于几乎不可能向用户传递有意义的信息。

因此有两种方法:

The theoretic one is to use a static analyzer. A piece of software that will examine the whole code at once in great detail and find all the flow paths. In practice I don't know any that would work here. The pragmatic one is to use an heuristic: use a code coverage tool (in the GNU chain it's gcov. Note that specific flags should be passed during compilation for it to work properly). You run the code coverage tool with a good set of varied inputs (your unit-tests or non-regression tests), the dead code is necessarily within the unreached code... and so you can start from here.

如果您对这个主题非常感兴趣，并且有时间和意愿自己开发一个工具，我建议您使用Clang库来构建这样一个工具。

使用Clang库获取AST(抽象语法树) 从入口点开始执行标记-清除分析

因为Clang将为您解析代码，并执行重载解析，所以您不必处理c++语言规则，并且您将能够集中精力处理手头的问题。

然而，这种技术不能识别未使用的虚拟覆盖，因为它们可能由您无法推理的第三方代码调用。

2011-01-27 09:25:04

如果某个函数将被调用的一般问题是np完全的。一般来说，你无法提前知道某个函数是否会被调用，就像你不知道图灵机是否会停止一样。如果存在从main()到您所编写的函数的某个路径(静态)，则可以获取，但这并不保证它将被调用。

2014-09-12 04:22:37

https://blog.flameeyes.eu/2008/01/today-how-to-identify-unused-exported-functions-and-variables

它几乎完整地描述了如何使用一些GCC标志，这些标志似乎是为了识别未引用的符号而设计的!

2013-07-11 03:43:00

一种方法是使用调试器和编译器特性，在编译过程中消除未使用的机器代码。

一旦某些机器代码被删除，调试器就不会让你在相应的源代码行上添加断点。因此，您将断点放置在任何地方，并启动程序并检查断点——那些处于“此源未加载代码”状态的断点对应于已消除的代码——要么该代码从未被调用，要么已内联，您必须执行一些最小分析，以找出这两者中哪一个发生了。

至少这是它在Visual Studio中的工作方式，我猜其他工具集也可以做到这一点。

这需要做很多工作，但我认为比手动分析所有代码要快。

2011-01-27 08:01:28

真正的答案是:你永远无法真正确定。

至少，对于重要的情况，你不能确定你已经得到了全部。考虑以下来自维基百科关于不可达代码的文章:

double x = sqrt(2);
if (x > 5)
{
  doStuff();
}

正如维基百科正确指出的那样，一个聪明的编译器也许能够捕捉到这样的东西。但是考虑一下修改:

int y;
cin >> y;
double x = sqrt((double)y);

if (x != 0 && x < 1)
{
  doStuff();
}

Will the compiler catch this? Maybe. But to do that, it will need to do more than run sqrt against a constant scalar value. It will have to figure out that (double)y will always be an integer (easy), and then understand the mathematical range of sqrt for the set of integers (hard). A very sophisticated compiler might be able to do this for the sqrt function, or for every function in math.h, or for any fixed-input function whose domain it can figure out. This gets very, very complex, and the complexity is basically limitless. You can keep adding layers of sophistication to your compiler, but there will always be a way to sneak in some code that will be unreachable for any given set of inputs.

还有一些输入集是永远不会被输入的。输入在现实生活中没有意义，或者在其他地方被验证逻辑阻塞。编译器没有办法知道这些。

这样做的最终结果是，虽然其他人提到的软件工具非常有用，但您永远无法确定您捕获了所有内容，除非您随后手动检查代码。即便如此，你也无法确定自己是否错过了什么。

恕我直言，唯一真正的解决方案是尽可能保持警惕，使用自动化，尽可能地重构，并不断寻找改进代码的方法。当然，这样做是个好主意。

2011-01-31 23:13:19

我如何知道代码中的哪些部分从未使用过?

推荐文章

最新文章

标签