80186 código de máquina + DOS, 91 bytes
Versão em texto:
hm j j PPjzjzjgaAAA JSJJ RU Sq ReAA JdJJJ RfiJElK JEiS GtI And she said But that s his
Versão em texto, com tabulações (código 9) substituídas por 9
e espaços (código 32) substituídos por *
:
hm9j9j9PPjzjzjgaAAA9JSJJ9RU9Sq9ReAA9JdJJJ9RfiJElK9JEiS*GtI*And*she*said***But*that*s*his***
Hexdump:
68 6D 09 6A 09 6A 09 50 50 6A 7A 6A 7A 6A 67 61
41 41 41 09 4A 53 4A 4A 09 52 55 09 53 71 09 52
65 41 41 09 4A 64 4A 4A 4A 09 52 66 69 4A 45 6C
4B 09 4A 45 69 53 20 47 74 49 20 41 6E 64 20 73
68 65 20 73 61 69 64 20 20 20 42 75 74 20 74 68
61 74 20 73 20 68 69 73 20 20 20
O código da máquina aparece em um arquivo com extensão .com
. Quando o executo, ele imprime a mensagem necessária e, em seguida, trava (executando dados aleatórios).
Explicação de alto nível sobre o que faz:
- Inicializa registradores com valores constantes
- Substitui os espaços na mensagem pelos símbolos especiais necessários (
,'.$
)
- Corrige o código para gerar a
int 21
instrução, que imprime a mensagem
- Chamadas DOS
Código de montagem (pode ser compilado com tasm
):
my_bp equ 7ah
my_si equ 7ah
my_di equ 67h
my_msg equ 13bh
.model tiny
.code
.startup
.186
org 100h
push 96dh ; ax (ah = 0; al = don't care, but see below)
push 9 ; cx
push 9 ; dx
push ax ; bx = don't care
push ax ; don't care
push my_bp
push my_si
push my_di
popa
inc cx
inc cx
inc cx
or [bp+si+my_msg-my_bp-my_si+12], cx ; ,
dec dx
dec dx
or [bp+si+my_msg-my_bp-my_si+14], dx ; '
or [bp+di+my_msg-my_bp-my_di+23], dx ; '
or [bp+si+my_msg-my_bp-my_si+30], dx ; '
inc cx
inc cx
or [bp+si+my_msg-my_bp-my_si+29], cx ; .
dec dx
dec dx
dec dx
or [bp+si+my_msg-my_bp-my_si+31], dx ; $
; 0x2049 * 0x4b6c = 0x98301cc
; So this sets cx to 1cc (a temporary constant used to patch code)
imul cx, [bp+si+my_msg-my_bp-my_si-2], 4b6ch
; 0x1cc | 0x2049 = 0x21cd (the instruction which calls DOS int 21)
; Here ah = 9 ("print" mode)
or [bp+si+my_msg-my_bp-my_si-2], cx
; At address 101, there is the constant 96d, which was loaded into ax
; 0x96d * 0x7447 = 0x448013b
; So the following sets dx to 13b (adddress of the message)
imul dx, [bp+di+101h-my_bp-my_di], 7447h
int21:
dw 2049h
db 'And she said But that s his '
end
Ele usa a popa
instrução para exibir todos os registros, porque o regular pop
não pode preencher todos os registros necessários (por exemplo, pop di
é um código de operação proibido).
Os endereços de bytes a serem corrigidos estão no intervalo 0x100 ... 0x160. Por sorte, eles podem ser representados como uma soma de 3 bytes com valores permitidos:
- 0x7a in
bp
- 0x7a ou 0x67 em
si
oudi
- Valor imediato
A correção de bytes na mensagem funciona de maneira lógica OR
em 0x20 (caractere de espaço) e uma pequena constante (4, 7, 12 ou 14). A pequena constante é obtida inicializando cx
e dx
até 9 (caractere de tabulação) e fazendo INC
ou DEC
conforme necessário.
O patch do código usa a IMUL
instrução Encontrei as constantes de 16 bits necessárias para multiplicar usando a pesquisa de força bruta.
Finalmente, o endereço da mensagem (0x13b) é obtido por multiplicação. Para economizar espaço, peguei uma das constantes de uma das instruções, que contém um valor imediato 0x96d
. Aqui, a 9
peça escolhe uma função de impressão do DOS e a 6d
peça é um parâmetro livre. Acontece que 6d
é a única possibilidade que pode dar 0x13b após a multiplicação.
Desmontagem da parte do código:
06BA:0100 686D09 PUSH 096D
06BA:0103 6A09 PUSH +09
06BA:0105 6A09 PUSH +09
06BA:0107 50 PUSH AX
06BA:0108 50 PUSH AX
06BA:0109 6A7A PUSH +7A
06BA:010B 6A7A PUSH +7A
06BA:010D 6A67 PUSH +67
06BA:010F 61 POPA
06BA:0110 41 INC CX
06BA:0111 41 INC CX
06BA:0112 41 INC CX
06BA:0113 094A53 OR [BP+SI+53],CX
06BA:0116 4A DEC DX
06BA:0117 4A DEC DX
06BA:0118 095255 OR [BP+SI+55],DX
06BA:011B 095371 OR [BP+DI+71],DX
06BA:011E 095265 OR [BP+SI+65],DX
06BA:0121 41 INC CX
06BA:0122 41 INC CX
06BA:0123 094A64 OR [BP+SI+64],CX
06BA:0126 4A DEC DX
06BA:0127 4A DEC DX
06BA:0128 4A DEC DX
06BA:0129 095266 OR [BP+SI+66],DX
06BA:012C 694A456C4B IMUL CX,[BP+SI+45],4B6C
06BA:0131 094A45 OR [BP+SI+45],CX
06BA:0134 6953204774 IMUL DX,[BP+DI+20],7447
06BA:0139 CD21 INT 21 (after the code patches itself)
Fato engraçado: Normalmente, eu usaria em offset message
vez do codificado 13bh
, mas nesse caso, porque no momento da análise de seu endereço é desconhecido, o tasm gera deslocamento imediato de 16 bits, desperdiçando 1 byte de código:
06BA:0131 098A4600 OR [BP+SI+0046],CX