strace应该如何使用?

一位同事曾经告诉我，当Linux上所有调试都失败时，最后的选择是使用strace。

我试图学习这个奇怪工具背后的科学，但我不是系统管理专家，我没有真正得到结果。

So,

它到底是什么，有什么作用? 如何以及在哪些情况下使用它? 应该如何理解和处理输出?

简而言之，简单地说，这东西是怎么工作的?

当前回答

下面是我如何使用strace挖掘网站的一些例子。希望这对你有帮助。

检查时间到第一个字节，如下所示:

time php index.php > timeTrace.txt

看看有多少百分比的动作在做什么。大量的lstat和fstat可能表明是时候清理缓存了:

strace -s 200 -c php index.php > traceLstat.txt

输出trace.txt，以便您可以准确地看到正在进行的调用。

strace -Tt -o Fulltrace.txt php index.php

使用它来检查是否有东西在0.1到0.9秒之间加载:

cat Fulltrace.txt | grep "[<]0.[1-9]" > traceSlowest.txt

查看strace中捕获了哪些丢失的文件或目录。这将输出很多涉及我们系统的东西-唯一相关的位涉及客户的文件:

strace -vv php index.php 2>&1 | sed -n '/= -1/p' > traceFailures.txt

其他回答

strace -tfp PID将监控PID进程的系统调用，因此我们可以调试/监控我们的进程/程序状态。

Strace列出它所应用的进程所执行的所有系统调用。如果您不知道系统调用是什么意思，那么您将无法从中获得很多好处。

然而，如果您的问题涉及到文件、路径或环境值，在有问题的程序上运行strace并将输出重定向到一个文件，然后在该文件中获取path/file/env字符串，这可能有助于您了解程序实际试图做什么，而不是您期望它做什么。

Strace是一个很好的工具，用于了解程序如何进行各种系统调用(对内核的请求)，并报告失败的调用以及与该失败相关的错误值。并不是所有的失败都是bug。例如，试图搜索文件的代码可能会得到ENOENT(没有这样的文件或目录)错误，但这可能是代码逻辑中可以接受的场景。

使用strace的一个很好的用例是在临时文件创建期间调试竞态条件。例如，通过将进程ID (PID)附加到某个预先确定的字符串来创建文件的程序在多线程场景中可能会遇到问题。PID+TID(进程id +线程id)或更好的系统调用(如mkstemp)将修复此问题。

它还适用于调试崩溃。您可能会发现这篇(我的)关于strace和调试崩溃的文章很有用。

下面是我如何使用strace挖掘网站的一些例子。希望这对你有帮助。

检查时间到第一个字节，如下所示:

time php index.php > timeTrace.txt

看看有多少百分比的动作在做什么。大量的lstat和fstat可能表明是时候清理缓存了:

strace -s 200 -c php index.php > traceLstat.txt

输出trace.txt，以便您可以准确地看到正在进行的调用。

strace -Tt -o Fulltrace.txt php index.php

使用它来检查是否有东西在0.1到0.9秒之间加载:

cat Fulltrace.txt | grep "[<]0.[1-9]" > traceSlowest.txt

查看strace中捕获了哪些丢失的文件或目录。这将输出很多涉及我们系统的东西-唯一相关的位涉及客户的文件:

strace -vv php index.php 2>&1 | sed -n '/= -1/p' > traceFailures.txt

Strace概述 Strace可以看作是一个轻量级调试器。它允许程序员/用户快速发现程序是如何与操作系统交互的。它通过监控系统调用和信号来做到这一点。

使用当你没有源代码或者不想被打扰去真正浏览它的时候，这很好。此外，如果您不喜欢打开GDB，而只是对理解外部交互感兴趣，那么对于您自己的代码也很有用。

这是一个很好的介绍下面是一个使用strace来调试进程挂起的温和介绍

推荐文章