给定整数值x和y, C和c++都返回q = x/y的商,即浮点等价物的底数。我感兴趣的是一种返回天花板的方法。例如,ceil(10/5)=2, ceil(11/5)=3。
最明显的方法是:
q = x / y;
if (q * y < x) ++q;
这需要额外的比较和乘法;我所见过的(实际上使用过的)其他方法都涉及到float或double类型的类型转换。有没有一种更直接的方法可以避免额外的乘法(或二次除法)和分支,同时也避免将类型转换为浮点数?
给定整数值x和y, C和c++都返回q = x/y的商,即浮点等价物的底数。我感兴趣的是一种返回天花板的方法。例如,ceil(10/5)=2, ceil(11/5)=3。
最明显的方法是:
q = x / y;
if (q * y < x) ++q;
这需要额外的比较和乘法;我所见过的(实际上使用过的)其他方法都涉及到float或double类型的类型转换。有没有一种更直接的方法可以避免额外的乘法(或二次除法)和分支,同时也避免将类型转换为浮点数?
当前回答
Sparky的回答是解决这个问题的一种标准方法,但正如我在评论中所写的,您将面临溢出的风险。这可以通过使用更宽的类型来解决,但是如果您想划分long long呢?
Nathan Ernst的答案提供了一个解决方案,但它涉及一个函数调用、一个变量声明和一个条件,这使得它并不比OPs代码短,甚至可能更慢,因为它更难优化。
我的解决方案是:
q = (x % y) ? x / y + 1 : x / y;
它将比OPs代码略快,因为取模和除法在处理器上使用相同的指令执行,因为编译器可以看到它们是等效的。至少gcc 4.4.1在x86上使用-O2标志执行此优化。
理论上,编译器可能会在Nathan Ernst的代码中内联函数调用并发出相同的东西,但gcc在我测试时没有这样做。这可能是因为它将编译的代码绑定到标准库的单个版本。
最后需要注意的是,在现代机器上,这些都无关紧要,除非您处于一个非常紧密的循环中,并且所有数据都在寄存器或l1缓存中。否则,所有这些解决方案都一样快,除了Nathan Ernst的,如果函数必须从主存中取出,它可能会明显慢一些。
其他回答
对于正x和负x都有一个解,但只对正y有一个除法,没有分支:
int div_ceil(int x, int y) {
return x / y + (x % y > 0);
}
注意,如果x是正的,那么除法趋向于零,如果提醒符不为零,我们应该加1。
如果x为负,除法趋向于0,这就是我们需要的,我们不加任何东西,因为x % y不为正
这适用于正数或负数:
q = x / y + ((x % y != 0) ? !((x > 0) ^ (y > 0)) : 0);
如果有余数,则检查x和y是否具有相同的符号,并相应地加1。
对于正数:
q = x/y + (x % y != 0);
我本想发表评论,但我的知名度不够高。
据我所知,对于正参数和2的幂的除数,这是最快的方法(在CUDA中测试过):
//example y=8
q = (x >> 3) + !!(x & 7);
对于一般的正面论证,我倾向于这样做:
q = x/y + !!(x % y);
使用O3编译,编译器优化性能良好。
q = x / y;
if (x % y) ++q;