“总线错误”消息是什么意思,它与分段错误有什么不同?
当前回答
mmap最小POSIX 7的例子
“总线错误”发生在内核向进程发送SIGBUS时。
一个因为ftruncate被遗忘而产生它的最小示例:
#include <fcntl.h> /* O_ constants */
#include <unistd.h> /* ftruncate */
#include <sys/mman.h> /* mmap */
int main() {
int fd;
int *map;
int size = sizeof(int);
char *name = "/a";
shm_unlink(name);
fd = shm_open(name, O_RDWR | O_CREAT, (mode_t)0600);
/* THIS is the cause of the problem. */
/*ftruncate(fd, size);*/
map = mmap(NULL, size, PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0);
/* This is what generates the SIGBUS. */
*map = 0;
}
运行:
gcc -std=c99 main.c -lrt
./a.out
在Ubuntu 14.04中测试。
POSIX将SIGBUS描述为:
访问内存对象的未定义部分。
mmap规范说:
在从pa开始的地址范围内引用,并在对象结束后继续为len bytes到整个页面,将导致SIGBUS信号的传递。
shm_open表示它生成大小为0的对象:
共享内存对象的大小为0。
因此,在*map = 0处,我们将触及已分配对象的末端。
ARMv8 aarch64中未对齐的堆栈内存访问
这在:什么是总线错误?对于SPARC,但是在这里我将提供一个更可重复的示例。
你所需要的是一个独立的aarch64程序:
.global _start
_start:
asm_main_after_prologue:
/* misalign the stack out of 16-bit boundary */
add sp, sp, #-4
/* access the stack */
ldr w0, [sp]
/* exit syscall in case SIGBUS does not happen */
mov x0, 0
mov x8, 93
svc 0
然后,该程序在ThunderX2服务器机器上的Ubuntu 18.04 aarch64和Linux内核4.15.0上引发SIGBUS。
不幸的是,我不能在QEMU v4.0.0用户模式上重现它,我不知道为什么。
该错误似乎是可选的,由SCTLR_ELx控制。SA和SCTLR_EL1。SA0字段,我在这里进一步总结了相关文档。
其他回答
我相信内核会引发SIGBUS 当应用程序显示数据时 数据总线上的不对中。我认为 那是因为大多数[?现代编译器 对于大多数处理器,垫/对齐 为程序员提供的数据 以前的对准问题(至少) 减轻,因此一个人看不见 这些天SIGBUS太频繁(AFAIK)。
来自:这里
这取决于你的操作系统、CPU、编译器以及其他因素。
一般来说,这意味着CPU总线无法完成命令或发生冲突,但这可能意味着一系列事情,具体取决于正在运行的环境和代码。
我同意上面所有的答案。以下是我对BUS错误的2点看法:
总线错误不需要由程序代码中的指令引起。这可能发生在您正在运行二进制文件,并且在执行过程中,二进制文件被修改(被构建覆盖或删除等)。
验证是否属实
检查原因的一个简单方法是在构建输出目录中启动两个相同二进制文件的实例,并在它们启动后运行构建。在构建完成并替换二进制文件(两个实例当前正在运行的二进制文件)后不久,这两个正在运行的实例都会崩溃并报出一个SIGBUS错误。
根本原因
这是因为操作系统交换内存页,在某些情况下,二进制文件可能不完全加载在内存中。当操作系统试图从相同的二进制文件中获取下一页时,这些崩溃就会发生,但二进制文件自上次读取以来已经发生了变化。
mmap最小POSIX 7的例子
“总线错误”发生在内核向进程发送SIGBUS时。
一个因为ftruncate被遗忘而产生它的最小示例:
#include <fcntl.h> /* O_ constants */
#include <unistd.h> /* ftruncate */
#include <sys/mman.h> /* mmap */
int main() {
int fd;
int *map;
int size = sizeof(int);
char *name = "/a";
shm_unlink(name);
fd = shm_open(name, O_RDWR | O_CREAT, (mode_t)0600);
/* THIS is the cause of the problem. */
/*ftruncate(fd, size);*/
map = mmap(NULL, size, PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0);
/* This is what generates the SIGBUS. */
*map = 0;
}
运行:
gcc -std=c99 main.c -lrt
./a.out
在Ubuntu 14.04中测试。
POSIX将SIGBUS描述为:
访问内存对象的未定义部分。
mmap规范说:
在从pa开始的地址范围内引用,并在对象结束后继续为len bytes到整个页面,将导致SIGBUS信号的传递。
shm_open表示它生成大小为0的对象:
共享内存对象的大小为0。
因此,在*map = 0处,我们将触及已分配对象的末端。
ARMv8 aarch64中未对齐的堆栈内存访问
这在:什么是总线错误?对于SPARC,但是在这里我将提供一个更可重复的示例。
你所需要的是一个独立的aarch64程序:
.global _start
_start:
asm_main_after_prologue:
/* misalign the stack out of 16-bit boundary */
add sp, sp, #-4
/* access the stack */
ldr w0, [sp]
/* exit syscall in case SIGBUS does not happen */
mov x0, 0
mov x8, 93
svc 0
然后,该程序在ThunderX2服务器机器上的Ubuntu 18.04 aarch64和Linux内核4.15.0上引发SIGBUS。
不幸的是,我不能在QEMU v4.0.0用户模式上重现它,我不知道为什么。
该错误似乎是可选的,由SCTLR_ELx控制。SA和SCTLR_EL1。SA0字段,我在这里进一步总结了相关文档。
总线错误现在在x86上很少见,发生在你的处理器甚至不能尝试请求的内存访问时,通常是:
使用具有不满足其对齐要求的地址的处理器指令。
分段错误发生在访问不属于你的进程的内存时。它们非常常见,通常是以下原因造成的:
使用指向已释放对象的指针。 使用未初始化的伪指针。 使用空指针。 缓冲区溢出。
PS:更准确地说,不是操作指针本身会导致问题。它正在访问它所指向的内存(解引用)。