何时使用不同的日志级别

有不同的方式记录消息，按死亡顺序排列：

致命的错误警告信息调试，调试跟踪

我如何决定何时使用哪个？

什么是好的启发式方法？

当前回答

这是一个古老的话题，但仍然相关。本周，我为同事们写了一篇关于它的小文章。出于这个目的，我还制作了这个备忘单，因为我在网上找不到。

2020-11-12 15:24:29

其他回答

我发现从查看日志文件的角度考虑严重性更有用。

致命/严重：应立即调查的整体应用程序或系统故障。是的，唤醒SysAdmin。因为我们更喜欢SysAdmins警报，并且休息良好，所以应该很少使用这种严重性。如果它每天都在发生，而这不是BFD，那么它就失去了意义。通常，致命错误在进程生命周期中只发生一次，因此如果日志文件与进程绑定，这通常是日志中的最后一条消息。

错误：肯定是一个应该调查的问题。SysAdmin应该被自动通知，但不需要被拖下床。通过过滤日志以查看错误和以上内容，您可以获得错误频率的概述，并可以快速识别可能导致额外错误级联的初始故障。跟踪错误率与应用程序使用率之间的关系可以得出有用的质量指标，如MTBF，可用于评估总体质量。例如，这个度量可能有助于在发布之前决定是否需要另一个测试周期。

警告：这可能是问题，也可能不是。例如，预期的瞬时环境条件（如网络或数据库连接短暂中断）应记录为警告，而不是错误。查看经过筛选的日志以仅显示警告和错误，可以快速了解后续错误的根本原因的早期提示。警告应谨慎使用，以免变得毫无意义。例如，失去网络访问应该是服务器应用程序中的一个警告，甚至是一个错误，但可能只是为偶尔断开连接的笔记本电脑用户设计的桌面应用程序的一个信息。

信息：这是在正常情况下应记录的重要信息，如成功初始化、服务启动和停止或重要事务的成功完成。查看显示“信息”及以上内容的日志应该可以快速概述流程中的主要状态更改，为理解任何警告或错误提供顶级上下文。不要有太多信息消息。相对于跟踪，我们通常有<5%的信息消息。

跟踪：跟踪是迄今为止最常用的严重性，应该提供上下文以了解导致错误和警告的步骤。拥有正确的跟踪消息密度可以使软件更易于维护，但需要一定的努力，因为随着程序的发展，单个跟踪语句的价值可能会随着时间的推移而变化。实现这一点的最佳方法是让开发团队养成定期查看日志的习惯，作为解决客户报告问题的标准部分。鼓励团队删除不再提供有用上下文的跟踪消息，并在需要时添加消息以了解后续消息的上下文。例如，记录用户输入（如更改显示或选项卡）通常很有用。

调试：我们考虑Debug＜Trace。区别在于调试消息是从发布版本编译出来的。也就是说，我们不鼓励使用调试消息。允许调试消息往往会导致越来越多的调试消息被添加，而从未删除过。随着时间的推移，这使得日志文件几乎无用，因为它太难从噪声中过滤信号。这导致开发人员不使用继续死亡螺旋的日志。相反，不断修剪Trace消息会鼓励开发人员使用这些消息，从而形成良性循环。此外，这消除了由于调试代码中所需的副作用而引入bug的可能性，这些副作用未包含在发布版本中。是的，我知道这不应该发生在好的代码中，但安全总比抱歉好。

2011-03-11 20:33:36

在此之前，我已经构建了以下系统：

错误-表示出现了严重错误，特定线程/进程/序列无法继续。需要一些用户/管理员干预警告-有些事情不正确，但过程可以照常进行（例如，一组100个作业中的一个作业失败，但剩余的作业可以处理）

在我所构建的系统中，管理员都在接受指示，以应对错误。另一方面，我们将观察警告，并确定每种情况是否需要任何系统更改、重新配置等。

2010-01-08 22:23:10

我认为，对于应用程序级别的日志记录来说，SYSLOG级别NOTICE和ALERT/EEMERGENCY在很大程度上是多余的-而CRITICAL/ALERT/EEMGENCY对于可能触发不同操作和通知的操作员来说可能是有用的警报级别，但对于应用程序管理员来说，这与FATAL相同。我只是无法充分区分被通知还是一些信息。如果信息不值得注意，那么它就不是真正的信息：）

我最喜欢Jay Cincotta的解释-跟踪代码的执行在技术支持中非常有用，应该鼓励将跟踪语句自由地放入代码中-尤其是与动态过滤机制结合使用，以记录来自特定应用程序组件的跟踪消息。然而，对我来说，DEBUG级别表明我们仍在弄清楚发生了什么——我认为DEBUG级输出只是一个开发选项，而不是应该在生产日志中显示的内容。

然而，对于OPERATIONAL消息，当我戴着系统管理员和技术支持甚至开发人员的帽子时，我希望在错误日志中看到一个日志级别。我使用它来记录时间戳、调用的操作类型、提供的参数、可能的（唯一）任务标识符和任务完成情况。例如，当一个独立的任务被启动时，它就被使用了，这是一个来自大型长时间运行的应用程序的真正调用。这是我希望始终记录的事情，无论是否有任何问题，所以我认为OPER级别高于致命级别，因此您只能通过进入完全静音模式来关闭它。它不仅仅是INFO日志数据，这是一个日志级别，经常被滥用，用于发送没有任何历史价值的小操作消息。

根据具体情况，这些信息可以被定向到单独的调用日志，或者可以通过从记录更多信息的大型日志中过滤出来获得。但是，作为历史信息，它总是需要知道正在做什么，而不是下降到AUDIT级别，这是另一个完全独立的日志级别，与故障或系统操作无关，并不真正符合上述级别（因为它需要自己的控制开关，而不是严重性分类），而且它肯定需要自己的独立日志文件。

2014-06-18 17:24:10

下面是“伐木工人”的清单。

Apache日志4j:§1，§2

致命：[v1.2:..]非常严重的错误事件，可能会导致应用程序中止。[v2.0:..]严重错误，将阻止应用程序继续运行。错误：[v1.2:..]可能仍然允许应用程序继续运行的错误事件。[v2.0:..]应用程序中的错误，可能可以恢复。警告：[v1.2:..]潜在的有害情况。[v2.0:..]事件可能导致错误。信息：[v1.2:..]在粗粒度级别突出显示应用程序进度的信息性消息。[v2.0:..]事件，仅供参考。调试：[v1.2:..]对调试应用程序最有用的细粒度信息事件。[v2.0:..]常规调试事件。跟踪：[v1.2:..]比DEBUG更细粒度的信息事件。[v2.0:..]细粒度调试消息，通常捕获通过应用程序的流。

Apache Httpd（和往常一样）喜欢过度使用：§

紧急情况：紧急情况–系统不可用。警觉的：必须立即采取行动[但系统仍然可用]。比容：关键条件[但无需立即采取行动]。套接字：无法获取套接字，正在退出子级错误：错误条件[但不重要]。“脚本头过早结束”警告：警告条件。[接近错误，但不是错误]通知：正常但显著的情况。httpd:捕获SIGBUS，试图在中转储核心信息：信息[和不可旋转]。[“服务器已运行x小时。”]调试：调试级消息[，即为调试而记录的消息）]。“正在打开配置文件…”痕迹1→ 痕迹6：跟踪消息[，即为跟踪而记录的消息]。“代理：FTP：控制连接完成”“proxy:CONNECT:向远程代理发送CONNECT请求”“openssl:握手：启动”“从缓冲SSL旅读取，模式0，17字节”“地图查找失败：map=rewriteitemap key=keyname”缓存查找失败，强制新的映射查找痕迹7→ 痕迹8：跟踪消息，转储大量数据“|0000:02 23 44 30 13 40 ac 34 df 3d bf 9a 19 49 39 15 |”“|0000:02 23 44 30 13 40 ac 34 df 3d bf 9a 19 49 39 15 |”

Apache commons日志记录：§

致命：导致提前终止的严重错误。期望这些在状态控制台上立即可见。错误：其他运行时错误或意外情况。期望这些在状态控制台上立即可见。警告：使用不推荐使用的API、API使用不当、“几乎”错误、其他不希望或意外但不一定“错误”的运行时情况。期望这些在状态控制台上立即可见。信息：有趣的运行时事件（启动/关闭）。期望这些在控制台上立即可见，所以要保守，尽量减少。调试：有关通过系统的流程的详细信息。期望这些仅写入日志。跟踪：更详细的信息。期望这些仅写入日志。

Apache commons记录企业使用的“最佳实践”，根据调试和信息跨越的界限来区分它们。

边界包括：

外部边界-预期异常。外部边界-意外异常。内部边界。重要内部边界。

（有关详细信息，请参阅commons日志记录指南。）

2016-04-15 20:14:00

可以从中恢复的警告。错误你不能。这是我的启发，其他人可能有其他想法。

例如，假设您在应用程序中输入/导入名称“Angela Müller”（注意u上的元音变音）。您的代码/数据库可能仅为英文（尽管它可能不应该在这个时代），因此可能会警告所有“不寻常”字符都已转换为普通英文字符。

与之形成对比的是，尝试将信息写入数据库，并连续60秒返回网络关闭消息。这与其说是警告，不如说是错误。

2010-01-08 22:22:48

何时使用不同的日志级别

推荐文章

最新文章

标签