对我来说,这就像一部时髦的电影。它的用途是什么?我应该什么时候使用它?
当前回答
在MOV上使用LEA的最大原因是,如果需要对用于计算地址的寄存器执行算术运算。实际上,您可以在几个寄存器上组合有效地“免费”执行相当于指针运算的操作
真正令人困惑的是,您通常会像MOV一样编写LEA,但实际上并没有取消对内存的引用。换句话说:
移动EAX,[ESP+4]
这将把ESP+4点的内容移动到EAX中。
LEA-EAX,[EBX*8]
这将把有效地址EBX*8移动到EAX,而不是在该位置找到的地址。正如您所看到的,当MOV仅限于加法/减法时,也可以乘以2的因子(缩放)。
其他回答
LEA指令可用于避免CPU对有效地址进行耗时的计算。如果地址被重复使用,则将其存储在寄存器中而不是每次使用时计算有效地址更有效。
在MOV上使用LEA的最大原因是,如果需要对用于计算地址的寄存器执行算术运算。实际上,您可以在几个寄存器上组合有效地“免费”执行相当于指针运算的操作
真正令人困惑的是,您通常会像MOV一样编写LEA,但实际上并没有取消对内存的引用。换句话说:
移动EAX,[ESP+4]
这将把ESP+4点的内容移动到EAX中。
LEA-EAX,[EBX*8]
这将把有效地址EBX*8移动到EAX,而不是在该位置找到的地址。正如您所看到的,当MOV仅限于加法/减法时,也可以乘以2的因子(缩放)。
8086有一大系列指令,它们接受寄存器操作数和有效地址,执行一些计算以计算该有效地址的偏移部分,并执行一些涉及寄存器和由计算地址引用的存储器的操作。除了跳过实际的内存操作之外,让该家族中的一个指令的行为与上面一样非常简单。因此,说明:
mov ax,[bx+si+5]
lea ax,[bx+si+5]
在内部实现几乎相同。区别在于跳过了一步。这两个指令的作用类似于:
temp = fetched immediate operand (5)
temp += bx
temp += si
address_out = temp (skipped for LEA)
trigger 16-bit read (skipped for LEA)
temp = data_in (skipped for LEA)
ax = temp
至于英特尔为什么认为这条指令值得包括在内,我并不完全确定,但它的实现成本低是一个重要因素。另一个因素是Intel的汇编器允许相对于BP寄存器定义符号。如果fnord被定义为BP相对符号(例如BP+8),可以说:
mov ax,fnord ; Equivalent to "mov ax,[BP+8]"
如果想使用stosw之类的东西将数据存储到BP的相对地址
mov ax,0 ; Data to store
mov cx,16 ; Number of words
lea di,fnord
rep movs fnord ; Address is ignored EXCEPT to note that it's an SS-relative word ptr
比:
mov ax,0 ; Data to store
mov cx,16 ; Number of words
mov di,bp
add di,offset fnord (i.e. 8)
rep movs fnord ; Address is ignored EXCEPT to note that it's an SS-relative word ptr
注意,忘记世界“偏移”将导致位置[BP+8]的内容而不是值8被添加到DI中。哎呀。
来自Abrash的“装配禅”:
LEA,唯一执行内存寻址计算但实际上不寻址内存的指令。LEA接受标准内存寻址操作数,但只会将计算出的内存偏移量存储在指定寄存器中,该寄存器可以是任何通用寄存器。这给了我们什么?ADD没有提供的两件事:使用两个或三个操作数执行加法的能力,以及将结果存储在任何寄存器中的能力;而不仅仅是源操作数之一。
执法机关不改变旗帜。
示例
LEA EAX,[EAX+EBX+1234567]计算EAX+EBX+134567(即三个操作数)LEA EAX,[EBX+ECX]计算EBX+ECX,而不使用结果覆盖两者。乘以常数(乘以2、3、5或9),如果你像LEA EAX那样使用,[EBX+N*EBX](N可以是1,2,4,8)。
其他用例在循环中很方便:LEA EAX、[EAX+1]和INC EAX之间的区别在于后者更改EFLAGS,但前者不更改;这保持了CMP状态。
这里有一个例子。
// compute parity of permutation from lexicographic index
int parity (int p)
{
assert (p >= 0);
int r = p, k = 1, d = 2;
while (p >= k) {
p /= d;
d += (k << 2) + 6; // only one lea instruction
k += 2;
r ^= p;
}
return r & 1;
}
使用-O(optimize)作为编译器选项,gcc将找到指定代码行的lea指令。
推荐文章
- ARM架构与x86有何不同?
- 为什么GCC在实现整数除法时使用奇数乘法?
- 基指针和堆栈指针到底是什么?他们指的是什么?
- 汇编代码vs机器代码vs目标代码?
- 什么是回跳线?它是如何工作的?
- 提交到App Store的问题:不支持架构x86
- “switch”比“if”快吗?
- 为什么Java在连续整数上的切换与添加的情况下运行得更快?
- 多核汇编语言是什么样子的?
- 如何在没有操作系统的情况下运行程序?
- 是否可以“反编译”Windows .exe?或者至少看看大会?
- 使用GCC产生可读的程序集?
- 如何用SSE4.2和AVX指令编译Tensorflow ?
- 为什么这段代码在对循环携带的加法进行强度降低的乘法运算后执行得更慢?
- 在Intel sandybridge系列cpu中对管道的程序进行反优化