Entendendo o opcode da instrução.
Como já foi dito antes existem opcodes cujo os 3 últimos bits são usados para identificar o registrador usado na instrução. Opcodes nesse estilo de codificação são usados para instruções que só precisam usar um registrador. Por exemplo mov eax, 123
cujo o opcode é B8
.
Já em instruções que usam o byte ModR/M os dois bits menos significativos do opcode tem um significado especial, que são chamados de bit D (direction bit) e S (size bit). Conforme ilustração:
A função do bit D é indicar a direção para onde a operação está sendo executada. Se do REG para o R/M ou vice-versa. Repare nas instruções abaixo e seus respectivos opcodes:
Convertendo os opcodes 8B
e 89
para binário dá para notar um fato interessante:
A única diferença entre os opcodes é que em um o bit D está ligado e no outro não. Quando o bit D está ligado o campo REG é usado como operando destino e o campo R/M usado como fonte. E quando ele está desligado é o inverso: o campo R/M é o destino e o REG é o fonte. Obviamente o mesmo também se aplica se o R/M também for um registrador.
Por exemplo a instrução xor eax, eax
pode ser escrita em código de máquina como 31 C0
ou 33 C0
. Como no campo REG e no campo R/M são os mesmos registradores não faz diferença qual é o fonte e qual é o destino, a operação executada será a mesma. Usando um disassembler como o ndisasm dá para notar isso:
O bit S é usado para definir o tamanho do operando, onde:
0
-> Indica que o operando é de 8-bit
1
-> Indica que o operando é do tamanho do operand-size.
Repare por exemplo a instrução 30 C0
:
Onde 31 C0
(com o bit S ligado) usa o operando de 32-bit EAX. Mas 30 C0
usa o operando de 8-bit AL.
Repare também no seguinte caso:
Veja que ao usar o prefixo 66
(operand-size override) em 31 C0
o registrador AX é utilizado. Mas esse prefixo é ignorado em instruções cujo o bit S esteja desligado. Por isso o ndisasm faz o disassembly da instrução ainda como xor al, al
. Embora ele adicione um o16
ali para denotar o uso (inútil) do prefixo.