código de máquina x86 (IA-32), 126 bytes
60 8b f9 57 33 c0 f2 ae 5e 2b fe 4f 87 fa 8d 1c
12 8b c3 48 f6 e3 c6 04 07 00 48 c6 04 07 20 75
f9 8b ea 4d 53 8d 04 2a 50 53 8b c5 f6 e3 8d 44
68 01 50 53 2b c2 8b c8 50 4b 53 55 53 03 c5 50
f7 d3 53 50 53 95 f6 e2 6b c0 04 50 43 53 51 6a
01 4a 52 6a 01 50 6a ff 51 b0 0a 6a 0b 8b dc 59
8b 6c cb fc 88 04 2f 03 2c cb 89 6c cb fc 83 f9
0a 75 01 ac e2 ea 4a 79 e0 83 c4 58 61 c3
Isso é um pouco longo, então, para explicar, darei o código C primeiro:
void doit(const char* s, char out[])
int n = strlen(s);
int w = 2 * n;
int h = w - 1;
int m = n - 1;
memset(out, ' ', h * w);
out[h * w] = 0;
int offset1 = n + m;
int offset2 = w * m + 2 * m + 1; // 2 * n * n - 1
int offset3 = offset2 - n; // 2 * n * n - n - 1
int offset4 = 4 * n * m; // 4 * n * n - 4 * n
int offsets[] = {
offset3, -1,
offset4, 1,
m, 1,
offset3, 1 - w,
offset4, -w,
offset2 - 1, -w,
offset2 - 1, w - 1,
m, w - 1,
offset3, w,
offset2, w,
offset1, w,
char c = *s++;
for (int i = 0; i < 11; ++i)
if (i == 9)
c = '\n';
int offset = offsets[i * 2];
assert(offset > 0 && offset < w * h);
out[offset] = c;
offsets[i * 2] += offsets[i * 2 + 1];
} while (--n);
Aqui n
está o comprimento da sequência de entrada.
As dimensões da área de saída são 2n
(largura) por 2n-1
(altura). Primeiro, ele preenche tudo com espaços (e adiciona um byte nulo final). Em seguida, ele percorre 11 linhas retas na área de saída e as preenche com texto:
- 2 linhas são preenchidas com bytes de fim de linha (= 10)
- 9 linhas são preenchidas com os bytes consecutivos da sequência de entrada
Cada linha é representada por dois números, um deslocamento inicial e um passo. Coloquei os dois na matriz offsets
, para tornar o acesso "fácil".
A parte interessante é preencher a matriz. Há pouca importância para a ordem das entradas na matriz; Tentei reorganizá-los para minimizar o número de conflitos de registro. Além disso, as fórmulas quadráticas têm alguma liberdade na escolha da forma de cálculo; Tentei minimizar o número de subtrações (porque as adições podem ser implementadas pela LEA
instrução flexível ).
Fonte de montagem:
; // Calculate the length of the input string
mov edi, ecx;
push edi;
xor eax, eax;
repne scasb;
pop esi; // esi = input string
sub edi, esi;
dec edi;
; // Calculate the size of the output area
xchg edi, edx; // edx = n
// edi = output string
lea ebx, [edx + edx]; // ebx = w
mov eax, ebx;
dec eax; // eax = h
mul bl; // eax = w * h
; // Fill the output string with spaces and zero terminate it
mov byte ptr [edi + eax], 0;
dec eax;
mov byte ptr [edi + eax], ' ';
jnz myfill;
mov ebp, edx;
dec ebp; // ebp = m
; // Fill the array of offsets
push ebx; // w
lea eax, [edx + ebp];
push eax; // offset1
push ebx; // w
mov eax, ebp;
mul bl;
lea eax, [eax + 2 * ebp + 1];
push eax; // offset2
push ebx; // w
sub eax, edx;
mov ecx, eax; // ecx = offset3
push eax; // offset3
dec ebx;
push ebx; // w - 1
push ebp; // m
push ebx; // w - 1
add eax, ebp;
push eax; // offset2 - 1
not ebx;
push ebx; // -w
push eax; // offset2 - 1
push ebx; // -w
xchg eax, ebp; // eax = m
mul dl;
imul eax, eax, 4;
push eax; // offset4
inc ebx;
push ebx; // 1 - w
push ecx; // offset3
push 1;
dec edx; // edx = n - 1
push edx;
push 1;
push eax;
push -1;
push ecx;
; // Use the array of offsets to write stuff to output
mov al, '\n';
push 11;
mov ebx, esp;
pop ecx;
mov ebp, [ebx + ecx * 8 - 4];
mov [edi + ebp], al;
add ebp, [ebx + ecx * 8];
mov [ebx + ecx * 8 - 4], ebp;
cmp ecx, 10;
jne skip_read;
loop myloop;
dec edx;
jns myout;
add esp, 11 * 8;
Eu usei multiplicações de bytes aqui, limitando o comprimento da string de entrada para 127. Isso evita que o registro seja prejudicado edx
- o produto é calculado ax
Uma pequena falha: ao preencher o array, o comprimento da string diminui em 1. Então eu ajustei a condição de saída do loop:
jns myout
Ele conta até -1.