在c++程序中以编程方式检测字节序

是否有一种编程方法来检测您使用的是大端序还是小端序体系结构?我需要能够编写将在英特尔或PPC系统上执行的代码，并使用完全相同的代码(即，没有条件编译)。

当前回答

…记得不能用令我惊讶的是，没有人意识到编译器会简单地优化测试，并将一个固定的结果作为返回值。这使得前面答案中的所有代码示例实际上都是无用的。

唯一会返回的是编译时的字节序!是的，我在之前的回答中测试了所有的例子。下面是一个使用Microsoft Visual c++ 9.0 (Visual Studio 2008)的示例。

纯C代码

int32 DNA_GetEndianness(void)
{
    union
    {
        uint8  c[4];
        uint32 i;
    } u;

    u.i = 0x01020304;

    if (0x04 == u.c[0])
        return DNA_ENDIAN_LITTLE;
    else if (0x01 == u.c[0])
        return DNA_ENDIAN_BIG;
    else
        return DNA_ENDIAN_UNKNOWN;
}

拆卸

PUBLIC    _DNA_GetEndianness
; Function compile flags: /Ogtpy
; File c:\development\dna\source\libraries\dna\endian.c
;    COMDAT _DNA_GetEndianness
_TEXT    SEGMENT
_DNA_GetEndianness PROC                    ; COMDAT

; 11   :     union
; 12   :     {
; 13   :         uint8  c[4];
; 14   :         uint32 i;
; 15   :     } u;
; 16   :
; 17   :     u.i = 1;
; 18   :
; 19   :     if (1 == u.c[0])
; 20   :         return DNA_ENDIAN_LITTLE;

    mov    eax, 1

; 21   :     else if (1 == u.c[3])
; 22   :         return DNA_ENDIAN_BIG;
; 23   :     else
; 24   :        return DNA_ENDIAN_UNKNOWN;
; 25   : }

    ret
_DNA_GetEndianness ENDP
END

也许可以为这个函数关闭任何编译时优化，但我不知道。否则，也许可以在汇编中硬编码，尽管那是不可移植的。即使这样，这个也可能被优化掉。这让我觉得我需要一些非常蹩脚的汇编器，为所有现有的cpu /指令集实现相同的代码，以及....不要紧。

此外，这里有人说，字节序在运行时不会改变。错了。现在有双端机器。它们的字节顺序在执行期间可以变化。而且，不仅有小端和大端，还有其他端。

2011-05-04 01:11:06

其他回答

声明一个int变量:

int variable = 0xFF;

现在使用char*指针指向它的各个部分，并检查这些部分中有什么。

char* startPart = reinterpret_cast<char*>( &variable );
char* endPart = reinterpret_cast<char*>( &variable ) + sizeof( int ) - 1;

根据哪一个指向0xFF字节，现在您可以检测到字节顺序。这需要sizeof(int) > sizeof(char)，但对于所讨论的平台绝对是正确的。

2009-06-16 13:00:05

除非你使用的框架已经移植到PPC和英特尔处理器上，否则你将不得不进行条件编译，因为PPC和英特尔平台拥有完全不同的硬件架构、管道、总线等。这使得两者的程序集代码完全不同。

至于查找字节序，请执行以下操作:

short temp = 0x1234;
char* tempChar = (char*)&temp;

您可以让tempChar为0x12或0x34，从中可以知道字节序。

2009-06-16 13:00:03

正如Coriiander所指出的，这里的大部分(如果不是全部的话)代码将在编译时被优化掉，因此生成的二进制文件不会在运行时检查“字节顺序”。

据观察，给定的可执行文件不应该以两个不同的字节顺序运行，但我不知道是否总是这样，对我来说，在编译时检查似乎是一种hack。所以我编写了这个函数:

#include <stdint.h>

int* _BE = 0;

int is_big_endian() {
    if (_BE == 0) {
        uint16_t* teste = (uint16_t*)malloc(4);
        *teste = (*teste & 0x01FE) | 0x0100;
        uint8_t teste2 = ((uint8_t*) teste)[0];
        free(teste);
        _BE = (int*)malloc(sizeof(int));
        *_BE = (0x01 == teste2);
    }
    return *_BE;
}

MinGW无法优化这段代码，尽管它确实优化了这里的其他代码。我相信这是因为我保留了分配在较小字节内存上的“随机”值(至少有7位)，所以编译器无法知道这个随机值是什么，也不会优化函数。

我还对函数进行了编码，以便只执行一次检查，并为下一次测试存储返回值。

2014-09-28 08:46:33

int i=1;
char *c=(char*)&i;
bool littleendian=c;

2009-06-16 13:01:09

如果你不想要条件编译，你可以写独立的代码。下面是一个例子(摘自Rob Pike):

以独立于端序的方式读取磁盘上以little-endian方式存储的整数:

i = (data[0]<<0) | (data[1]<<8) | (data[2]<<16) | (data[3]<<24);

同样的代码，试图考虑到机器的字节顺序:

i = *((int*)data);
#ifdef BIG_ENDIAN
/* swap the bytes */
i = ((i&0xFF)<<24) | (((i>>8)&0xFF)<<16) | (((i>>16)&0xFF)<<8) | (((i>>24)&0xFF)<<0);
#endif

2017-02-17 11:58:49

在c++程序中以编程方式检测字节序

推荐文章

最新文章

标签