对我来说,这就像一部时髦的电影。它的用途是什么?我应该什么时候使用它?
当前回答
也许只是LEA指令的另一件事。您还可以使用LEA将寄存器快速乘以3、5或9。
LEA EAX, [EAX * 2 + EAX] ;EAX = EAX * 3
LEA EAX, [EAX * 4 + EAX] ;EAX = EAX * 5
LEA EAX, [EAX * 8 + EAX] ;EAX = EAX * 9
其他回答
尽管有各种解释,LEA是一种算术运算:
LEA Rt, [Rs1+a*Rs2+b] => Rt = Rs1 + a*Rs2 + b
只是它的名字对于shift+add操作来说非常愚蠢。其原因已经在最高评级的答案中解释过(即,它是为了直接映射高级内存引用而设计的)。
8086有一大系列指令,它们接受寄存器操作数和有效地址,执行一些计算以计算该有效地址的偏移部分,并执行一些涉及寄存器和由计算地址引用的存储器的操作。除了跳过实际的内存操作之外,让该家族中的一个指令的行为与上面一样非常简单。因此,说明:
mov ax,[bx+si+5]
lea ax,[bx+si+5]
在内部实现几乎相同。区别在于跳过了一步。这两个指令的作用类似于:
temp = fetched immediate operand (5)
temp += bx
temp += si
address_out = temp (skipped for LEA)
trigger 16-bit read (skipped for LEA)
temp = data_in (skipped for LEA)
ax = temp
至于英特尔为什么认为这条指令值得包括在内,我并不完全确定,但它的实现成本低是一个重要因素。另一个因素是Intel的汇编器允许相对于BP寄存器定义符号。如果fnord被定义为BP相对符号(例如BP+8),可以说:
mov ax,fnord ; Equivalent to "mov ax,[BP+8]"
如果想使用stosw之类的东西将数据存储到BP的相对地址
mov ax,0 ; Data to store
mov cx,16 ; Number of words
lea di,fnord
rep movs fnord ; Address is ignored EXCEPT to note that it's an SS-relative word ptr
比:
mov ax,0 ; Data to store
mov cx,16 ; Number of words
mov di,bp
add di,offset fnord (i.e. 8)
rep movs fnord ; Address is ignored EXCEPT to note that it's an SS-relative word ptr
注意,忘记世界“偏移”将导致位置[BP+8]的内容而不是值8被添加到DI中。哎呀。
正如前面提到的现有答案,LEA具有执行内存寻址运算而不访问内存的优点,将运算结果保存到不同的寄存器,而不是简单形式的加法指令。真正的潜在性能优势是现代处理器有一个单独的LEA ALU单元和端口,用于有效的地址生成(包括LEA和其他内存参考地址),这意味着LEA中的算术运算和ALU中的其他正常算术运算可以在一个核中并行完成。
查看Haswell架构的这篇文章,了解LEA单元的一些详细信息:http://www.realworldtech.com/haswell-cpu/4/
其他答案中未提及的另一个重要点是LEA REG,[MemoryAddress]指令是PIC(位置无关代码),它将此指令中的PC相对地址编码为参考MemoryAddress。这不同于MOV REG,MemoryAddress编码相对虚拟地址,需要在现代操作系统中重新定位/修补(如ASLR是常见功能)。因此,LEA可用于将非PIC转换为PIC。
LEA指令可用于避免CPU对有效地址进行耗时的计算。如果地址被重复使用,则将其存储在寄存器中而不是每次使用时计算有效地址更有效。
LEA vs MOV(回复原始问题)
LEA不是一个时髦的MOV。当您使用MOV时,它会计算地址并访问内存。LEA只计算地址,实际上不访问内存。这就是区别。
在8086及更高版本中,LEA仅将最多两个源寄存器和一个立即数的和设置为目标寄存器。例如,lea-bp,[bx+si+3]将bx加si加3的和设置到bp寄存器。无法实现此计算以将结果保存到带有MOV的寄存器中。
80386处理器引入了一系列缩放模式,其中索引寄存器值可以乘以有效的缩放因子以获得位移。有效比例因子为1、2、4和8。因此,您可以使用lea-ebp、[ebx+esi*8+3]等指令。
LDS和LES(可选进一步阅读)
与LEA相反,有指令LDS和LES,相反,它们将值从内存加载到一对寄存器:一个段寄存器(DS或ES)和一个通用寄存器。其他寄存器也有版本:分别用于FS、GS和SS段寄存器的LFS、LGS和LSS(80386中介绍)。
因此,这些指令加载“远”指针-一个由16位段选择器和16位(或32位,取决于模式)偏移量组成的指针,因此在16位模式下,远指针的总大小为32位,在32位模式下为48位。
这些是16位模式的方便说明,无论是16位实际模式还是16位保护模式。
在32位模式下,由于操作系统将所有段基设置为零(平面内存模型),所以不需要加载这些指令,因此不需要加载段寄存器。我们只使用32位指针,而不是48位指针。
在64位模式下,不执行这些指令。它们的操作码会导致访问违规中断(异常)。自从Intel实施VEX“矢量扩展”(AVX)以来,Intel采用了LDS和LES的操作码,并开始将它们用于VEX前缀。正如Peter Cordes所指出的,这就是为什么在32位模式下只能访问x/ymm0..7的原因(引用):“VEX前缀经过精心设计,仅与32位模式中LDS和LES的无效编码重叠,其中RÜxÜBÜ均为1。这就是为什么某些位在VEX前缀中被反转的原因”。
推荐文章
- 测试点%eax %eax
- Trap和中断的区别是什么?
- 为什么程序不是经常用汇编编写的?
- 保护可执行文件不受逆向工程的影响?
- “每个程序员应该知道的关于内存的事情”有多少仍然是有效的?
- 在GDB中显示当前的组装指令
- 为什么引入无用的MOV指令会加速x86_64汇编中的紧循环?
- ARM架构与x86有何不同?
- 为什么GCC在实现整数除法时使用奇数乘法?
- 基指针和堆栈指针到底是什么?他们指的是什么?
- 汇编代码vs机器代码vs目标代码?
- 什么是回跳线?它是如何工作的?
- 提交到App Store的问题:不支持架构x86
- “switch”比“if”快吗?
- 为什么Java在连续整数上的切换与添加的情况下运行得更快?