这四行复杂的C代码背后的概念

也许理解代码最简单的方法是反向处理。我们将从一个字符串开始打印—为了平衡，我们将使用“c++ Rocks”。关键是:和原版一样，它只有8个字长。因为我们要做(大致)像原来的，并以相反的顺序打印出来，我们将开始把它放在相反的顺序。在我们的第一步中，我们将把这个位模式视为double，并打印出结果:

#include <stdio.h>

char string[] = "skcoR++C";

int main(){
    printf("%f\n", *(double*)string);
}

这将产生3823728713643449.5。所以，我们想要以某种不明显，但很容易逆转的方式来处理它。我将半任意地选择乘256，得到978874550692723072。现在，我们只需要写一些模糊的代码来除以256，然后按相反的顺序打印出每个字节:

#include <stdio.h>

double x [] = { 978874550692723072, 8 };
char *y = (char *)x;

int main(int argc, char **argv){
    if (x[1]) {
        x[0] /= 2;  
        main(--x[1], (char **)++y);
    }
    putchar(*--y);
}

现在我们有很多强制转换，将参数传递给(递归)main，这些参数完全被忽略了(但是求值以获得递增和递减值是非常关键的)，当然，这个看起来完全随意的数字掩盖了我们正在做的事情非常简单的事实。

当然，因为重点在于混淆，如果我们喜欢，我们也可以采取更多步骤。例如，我们可以利用短路求值，将if语句转换为单个表达式，因此main的主体看起来像这样:

x[1] && (x[0] /= 2,  main(--x[1], (char **)++y));
putchar(*--y);

对于任何不习惯混淆代码(和/或代码高尔夫)的人来说，这看起来确实非常奇怪——计算并丢弃一些毫无意义的浮点数的逻辑和，以及main的返回值，这甚至没有返回值。更糟糕的是，如果没有意识到(并思考)短路求值是如何工作的，甚至可能无法立即看出它是如何避免无限递归的。

我们的下一步可能是将打印每个字符与查找该字符分开。我们可以很容易地通过生成正确的字符作为main的返回值，并打印出main返回的内容:

x[1] && (x[0] /= 2,  putchar(main(--x[1], (char **)++y)));
return *--y;

至少对我来说，这看起来很混乱，所以我就到此为止。

2013-08-03 03:33:15

也许理解代码最简单的方法是反向处理。我们将从一个字符串开始打印—为了平衡，我们将使用“c++ Rocks”。关键是:和原版一样，它只有8个字长。因为我们要做(大致)像原来的，并以相反的顺序打印出来，我们将开始把它放在相反的顺序。在我们的第一步中，我们将把这个位模式视为double，并打印出结果:

#include <stdio.h>

char string[] = "skcoR++C";

int main(){
    printf("%f\n", *(double*)string);
}

这将产生3823728713643449.5。所以，我们想要以某种不明显，但很容易逆转的方式来处理它。我将半任意地选择乘256，得到978874550692723072。现在，我们只需要写一些模糊的代码来除以256，然后按相反的顺序打印出每个字节:

#include <stdio.h>

double x [] = { 978874550692723072, 8 };
char *y = (char *)x;

int main(int argc, char **argv){
    if (x[1]) {
        x[0] /= 2;  
        main(--x[1], (char **)++y);
    }
    putchar(*--y);
}

现在我们有很多强制转换，将参数传递给(递归)main，这些参数完全被忽略了(但是求值以获得递增和递减值是非常关键的)，当然，这个看起来完全随意的数字掩盖了我们正在做的事情非常简单的事实。

当然，因为重点在于混淆，如果我们喜欢，我们也可以采取更多步骤。例如，我们可以利用短路求值，将if语句转换为单个表达式，因此main的主体看起来像这样:

x[1] && (x[0] /= 2,  main(--x[1], (char **)++y));
putchar(*--y);

对于任何不习惯混淆代码(和/或代码高尔夫)的人来说，这看起来确实非常奇怪——计算并丢弃一些毫无意义的浮点数的逻辑和，以及main的返回值，这甚至没有返回值。更糟糕的是，如果没有意识到(并思考)短路求值是如何工作的，甚至可能无法立即看出它是如何避免无限递归的。

我们的下一步可能是将打印每个字符与查找该字符分开。我们可以很容易地通过生成正确的字符作为main的返回值，并打印出main返回的内容:

x[1] && (x[0] /= 2,  putchar(main(--x[1], (char **)++y)));
return *--y;

至少对我来说，这看起来很混乱，所以我就到此为止。

2013-08-03 03:33:15

免责声明:这个答案被发布到问题的原始形式中，它只提到了c++，并包含了一个c++头。问题转换为纯C是由社区完成的，没有来自最初提问者的输入。

从形式上讲，不可能对这个程序进行推理，因为它是病态的(即它不是合法的c++)。它违反了c++ 11[basic.start.main]p3:

函数main不能在程序中使用。

This aside, it relies on the fact that on a typical consumer computer, a double is 8 bytes long, and uses a certain well-known internal representation. The initial values of the array are computed so that when the "algorithm" is performed, the final value of the first double will be such that the internal representation (8 bytes) will be the ASCII codes of the 8 characters C++Sucks. The second element in the array is then 0.0, whose first byte is 0 in the internal representation, making this a valid C-style string. This is then sent to output using printf().

在HW上运行这个，上面的一些不支持将导致垃圾文本(甚至可能是一个越界的访问)。

2013-08-01 11:26:02

更易读的版本:

double m[2] = {7709179928849219.0, 771};
// m[0] = 7709179928849219.0;
// m[1] = 771;    

int main()
{
    if (m[1]-- != 0)
    {
        m[0] *= 2;
        main();
    }
    else
    {
        printf((char*) m);
    }
}

它递归调用main() 771次。

开始时，m[0] = 7709179928849219.0，代表c++ Suc;C。在每次调用中，m[0]被加倍，以“修复”最后两个字母。在最后一个调用中，m[0]包含c++ Sucks的ASCII字符表示，m[1]只包含0，因此它有一个用于c++ Sucks字符串的空结束符。所有这些都假设m[0]存储在8个字节中，因此每个char占用1个字节。

如果没有递归和非法的main()调用，它将看起来像这样:

double m[] = {7709179928849219.0, 0};
for (int i = 0; i < 771; i++)
{
    m[0] *= 2;
}
printf((char*) m);

2013-08-01 11:27:16

下面的代码打印c++的Suc;C，所以整个乘法只针对最后两个字母

double m[] = {7709179928849219.0, 0};
printf("%s\n", (char *)m);

2013-08-01 11:37:53

首先，我们应该回忆一下，双精度数以二进制格式存储在内存中，如下所示:

(i)符号为1位

(ii)指数为11位

(iii)幅值为52位

位序从(i)递减到(iii)。

首先将十进制小数转换为等效的小数二进制数，然后用二进制表示为数量级形式。

所以数字7709179928849219.0就变成了

(11011011000110111010101010011001010110010101101000011)base 2


=1.1011011000110111010101010011001010110010101101000011 * 2^52

现在在考虑大小比特1。由于所有数量级方法都从1开始，因此忽略。

所以大小部分变成:

1011011000110111010101010011001010110010101101000011

现在2的幂是52，我们需要将偏置数加到2^(指数-1位)-1 即2^(11 -1)-1 =1023，所以指数变成52 + 1023 = 1075

现在我们的代码将这个数字乘以2,771，这使得指数增加了771

所以我们的指数是(1075+771)= 1846它的二进制等价是(11100110110)

现在数字是正的，所以符号位是0。

那么我们的修正数就变成:

符号位+指数+幅度(位的简单连接)

0111001101101011011000110111010101010011001010110010101101000011

由于m被转换为char指针，我们将把LSD中的位模式分成8个块

01110011 01101011 01100011 01110101 01010011 00101011 00101011 01000011

(其十六进制等效为:)

 0x73 0x6B 0x63 0x75 0x53 0x2B 0x2B 0x43

如图所示的字符映射为:

s   k   c   u      S      +   +   C

现在，一旦这个已经完成，m[1]是0，这意味着一个NULL字符

现在假设你在一个小端序机器上运行这个程序(低阶位存储在较低的地址中)，那么指针m指向最低的地址位，然后继续占用8字节的字节(作为类型转换为char*)，当在最后一个块中遇到00000000时printf()停止…

但是这段代码是不可移植的。

2019-03-17 18:22:40

这四行复杂的C代码背后的概念

推荐文章

最新文章

标签