什么是总线错误?它与分割错误不同吗?

“总线错误”消息是什么意思，它与分段错误有什么不同?

当前回答

我同意上面所有的答案。以下是我对BUS错误的2点看法:

总线错误不需要由程序代码中的指令引起。这可能发生在您正在运行二进制文件，并且在执行过程中，二进制文件被修改(被构建覆盖或删除等)。

验证是否属实

检查原因的一个简单方法是在构建输出目录中启动两个相同二进制文件的实例，并在它们启动后运行构建。在构建完成并替换二进制文件(两个实例当前正在运行的二进制文件)后不久，这两个正在运行的实例都会崩溃并报出一个SIGBUS错误。

根本原因

这是因为操作系统交换内存页，在某些情况下，二进制文件可能不完全加载在内存中。当操作系统试图从相同的二进制文件中获取下一页时，这些崩溃就会发生，但二进制文件自上次读取以来已经发生了变化。

2018-10-30 16:26:01

其他回答

当根目录为100%时，我得到一个总线错误。

2016-06-16 03:39:51

我试图释放一个不小心在堆栈上的字符串:

#include <stdlib.h>

int main(void)
{
    char *str = "foo";
    free(str);
    return (EXIT_SUCCESS);
}

我的修复是strdup()堆栈上的字符串:

#include <stdlib.h>
#include <string.h>

int main(void)
{
    char *str = strdup("foo");
    free(str);
    return (EXIT_SUCCESS);
}

2022-12-23 16:36:18

首先，SIGBUS和SIGSEGV不是特定类型的错误，而是错误组或错误族。这就是为什么您通常会看到一个信号数(si_no)和一个信号代码(si_code)。

它们还取决于操作系统和体系结构，具体是什么导致了它们。

一般来说我们可以这么说。 SIGSEGV与内存映射(权限，无映射)相关，即mmu错误。

SIGBUS是当内存映射成功时，你遇到了底层内存系统的问题(内存不足，该位置没有内存，对齐，smmu阻止访问等)，即总线错误。

一个SIGBUS也可以与mmap文件，如果文件从系统中消失，例如，你mmap文件在一个可移动媒体上，它被拔出。

查看平台的一个好地方是siginfo.h标头，以了解信号子类型。这个页面提供了一个概述。 https://elixir.bootlin.com/linux/latest/source/include/uapi/asm-generic/siginfo.h#L245

/*
 * SIGSEGV si_codes
 */
#define SEGV_MAPERR 1   /* address not mapped to object */
#define SEGV_ACCERR 2   /* invalid permissions for mapped object */
#define SEGV_BNDERR 3   /* failed address bound checks */
#ifdef __ia64__
# define __SEGV_PSTKOVF 4   /* paragraph stack overflow */
#else
# define SEGV_PKUERR    4   /* failed protection key checks */
#endif
#define SEGV_ACCADI 5   /* ADI not enabled for mapped object */
#define SEGV_ADIDERR    6   /* Disrupting MCD error */
#define SEGV_ADIPERR    7   /* Precise MCD exception */
#define SEGV_MTEAERR    8   /* Asynchronous ARM MTE error */
#define SEGV_MTESERR    9   /* Synchronous ARM MTE exception */
#define NSIGSEGV    9

/*
 * SIGBUS si_codes
 */
#define BUS_ADRALN  1   /* invalid address alignment */
#define BUS_ADRERR  2   /* non-existent physical address */
#define BUS_OBJERR  3   /* object specific hardware error */
/* hardware memory error consumed on a machine check: action required */
#define BUS_MCEERR_AR   4
/* hardware memory error detected in process but not consumed: action optional*/
#define BUS_MCEERR_AO   5
#define NSIGBUS     5

最后需要注意的是，所有信号都可以由用户生成，例如kill。如果它是用户生成的，那么si_code就是SI_USER。所以特殊源得到负si_codes。

/*
 * si_code values
 * Digital reserves positive values for kernel-generated signals.
 */
#define SI_USER     0       /* sent by kill, sigsend, raise */
#define SI_KERNEL   0x80        /* sent by the kernel from somewhere */
#define SI_QUEUE    -1      /* sent by sigqueue */
#define SI_TIMER    -2      /* sent by timer expiration */
#define SI_MESGQ    -3      /* sent by real time mesq state change */
#define SI_ASYNCIO  -4      /* sent by AIO completion */
#define SI_SIGIO    -5      /* sent by queued SIGIO */
#define SI_TKILL    -6      /* sent by tkill system call */
#define SI_DETHREAD -7      /* sent by execve() killing subsidiary threads */
#define SI_ASYNCNL  -60     /* sent by glibc async name lookup completion */

#define SI_FROMUSER(siptr)  ((siptr)->si_code <= 0)
#define SI_FROMKERNEL(siptr)    ((siptr)->si_code > 0)

2021-07-04 14:26:29

它通常表示未对齐的访问。

试图访问物理上不存在的内存也会产生总线错误，但如果您使用的是带有MMU的处理器和没有bug的操作系统，则不会看到这个错误，因为您不会将任何不存在的内存映射到进程的地址空间。

2008-10-17 14:57:03

总线错误现在在x86上很少见，发生在你的处理器甚至不能尝试请求的内存访问时，通常是:

使用具有不满足其对齐要求的地址的处理器指令。

分段错误发生在访问不属于你的进程的内存时。它们非常常见，通常是以下原因造成的:

使用指向已释放对象的指针。使用未初始化的伪指针。使用空指针。缓冲区溢出。

PS:更准确地说，不是操作指针本身会导致问题。它正在访问它所指向的内存(解引用)。

2008-10-17 15:12:09

什么是总线错误?它与分割错误不同吗?

推荐文章

最新文章

标签