Perl, 438291 caracteres
Inspirado pelo uso da compactação DEFLATE por Jeff Burdges , pelo código Ruby compactado do Ventero e pelo uso de Lingua :: EN :: Numbers pela JB , consegui compactar minha entrada para 291 caracteres (bem, bytes), incluindo o código de descompressão. Como o programa contém alguns caracteres não imprimíveis, eu o forneci no formato MIME Base64 :
dXNlIENvbXByZXNzOjpabGliO2V2YWwgdW5jb21wcmVzcyAneNolkMFqAkEMhu8+RVgELdaIXmXB
S2/FFyhF4k7cHTqTsclMZd++M3pJvo+QH5JiDJ9exkKrj/PqXOKV1bod77qj9b2UeGBZ7w/bpd9s
3rCDruf3uWtwS3qS/vfROy0xsho+oWbB3d+b19YsJHWGhIHp5eQ8GzqSoWkk/xxHH36a24OkuT38
K21kNm77ND81BceCWtlgoBAq4NWrM7gpyzDhxGKQi+bA6NIfG5K4/mg0d0kgTwwdvi67JHVeKKyX
l3acoxnSDYZJveVIBnGGrIUh1BQYqZacIDKc5Gvpt1vEk3wT3EmzejcyeIGqTApZmRftR7BH3B8W
/5Aze7In
Para descriptografar o programa, você pode usar o seguinte script auxiliar Perl:
use MIME::Base64;
print decode_base64 $_ while <>;
Salve a saída em um arquivo nomeado 12days.pl
e execute-o com perl -M5.01 12days.pl
. Como observado, você precisa ter o módulo Lingua :: EN :: Numbers instalado para que o código funcione.
Caso você esteja se perguntando, a parte legível do código simplesmente se parece com isso:
use Compress::Zlib;eval uncompress '...'
onde ...
significa 254 bytes de RFC 1950 compactado código Perl. Descompactado, o código tem 361 caracteres e fica assim:
use Lingua'EN'Numbers"/e/";s==num2en(12-$i++)." "=e,y"." "for@n=qw=drummers.drumming pipers.piping lords.a.leaping ladies.dancing maids.a.milking swans.a.swimming geese.a.laying golden.rings calling.birds french.hens turtle.doves.and=;say"on the ".num2en_ordinal($_)." day of christmas my true love gave to me @n[$i--..@n]a partridge in a pear tree
"for 1..12
Escrever esse código era um tipo estranho de exercício de golfe: a repetição maximizada e a minimização do número de caracteres distintos usados são muito mais importantes do que minimizar a contagem bruta de caracteres quando a métrica relevante é o tamanho após a compactação .
Para extrair os últimos caracteres, escrevi um programa simples para tentar pequenas variações desse código e encontrar o que comprime melhor. Para compactação, usei o utilitário KZIP de Ken Silverman , que normalmente produz melhores rações de compactação (ao custo da velocidade) do que o Zlib padrão, mesmo nas configurações de compactação máxima. Obviamente, como o KZIP cria apenas arquivos ZIP, tive que extrair o fluxo DEFLATE bruto do arquivo e envolvê-lo em um cabeçalho e soma de verificação RFC 1950. Aqui está o código que usei para isso:
use Compress::Zlib;
use 5.010;
@c = qw(e i n s);
@q = qw( " );
@p = qw( = @ ; , );
@n = ('\n',"\n");
$best = 999;
for$A(qw(e n .)){ for$B(@q){ for$C(@q,@p){ for$D(@p){ for$E(@q,@p){ for$F(qw(- _ . N E)){ for$G("-","-"eq$F?():$F){ for$H(@c){ for$I(@c,@p){ for$N(@n){ for$X(11,"\@$I"){ for$Y('$"','" "',$F=~/\w/?$F:()){ for$Z('".num2en_ordinal($_)."'){
$M="Lingua'EN'Numbers";
$code = q!use MB/A/B;sDDnum2en(12-$H++).YDe,yCFC Cfor@I=qwEdrummersFdrumming pipersFpiping lordsGaGleaping ladiesFdancing maidsGaGmilking swansGaGswimming geeseGaGlaying goldenFrings callingFbirds frenchFhens turtleFdovesFandE;say"on the Z day of christmas my true love gave to me @I[$H--..X]a partridge in a pear treeN"for 1..12!.$/;
$code =~ s/[A-Z]/${$&}/g;
open PL, ">12days.pl" and print PL $code and close PL or die $!;
$output = `kzipmix-20091108-linux/kzip -b0 -y 12days.pl.zip 12days.pl`;
($len) = ($output =~ /KSflating\s+(\d\d\d)/) or die $output;
open ZIP, "<12days.pl.zip" and $zip = join("", <ZIP>) and close ZIP or die $!;
($dfl) = ($zip =~ /12days\.pl(.{$len})/s) or die "Z $len: $code";
$dfl = "x\xDA$dfl" . pack N, adler32($code);
$dfl =~ s/\\(?=[\\'])|'/\\$&/g;
next if $best <= length $dfl;
$best = length $dfl;
$bestcode = $code;
warn "$A$B$C$D$E$F$G$H$I $X $Y $best: $bestcode\n";
open PL, ">12days_best.pl" and print PL "use Compress::Zlib;eval uncompress '$dfl'" and close PL or die $!;
}}}}}}
print STDERR "$A$B$C$D$E$F\r";
}}}}}}}
Se isso parece um kluge horrível, é porque é exatamente o que é.
Para interesse histórico, aqui está minha solução original de 438 caracteres, que gera uma saída melhor, incluindo quebras de linha e pontuação:
y/_/ /,s/G/ing/for@l=qw(twelve_drummers_drummG eleven_pipers_pipG ten_lords-a-leapG nine_ladies_dancG eight_maids-a-milkG seven_swans-a-swimmG six_geese-a-layG five_golden_rGs four_callG_birds three_french_hens two_turtle_doves);s/e?t? .*/th/,s/vt/ft/for@n=@l;@n[9..11]=qw(third second first);say map("\u$_,\n","\nOn the $n[11-$_] day of Christmas,\nMy true love gave to me",@l[-$_..-1]),$_?"And a":A," partridge in a pear tree."for 0..11
Destaques desta versão o par de regexps s/e?t? .*/th/,s/vt/ft/
, que constroem os ordinais de 4 a 12 a partir dos cardeais no início das linhas de presentes.
Obviamente, esse código também pode ser compactado usando o truque Zlib descrito acima, mas acontece que simplesmente compactar a saída é mais eficiente, produzindo o seguinte programa de 338 bytes (no formato Base64, novamente):
dXNlIENvbXByZXNzOjpabGliO3NheSB1bmNvbXByZXNzICd42uWTwU7DMAyG730KP8DGOyA0bsCB
vYBp3MYicSo7W9e3xx3ijCIQDHZIUjn683+/k3ZPAjUSDKxWIeACZYC7qGw1o226hwWqHghSORKM
6FMtkGnT3cKEWpXDSMACCBOhQlWim+7jUKO+SGg5dT8XqAetiSD4nrmPBMDPvXywtllF18OgJH2E
SGJfcR+Ky2KL/b0roMeUWEZ4cXb7biQeGol4LZQUSECdyn4A0vjUBvnMXCcYiYy2uE24ONcvgdOR
pBF9lYDNKObwNnPOTnc5kYjH2JZotyogI4c1Ueb06myXH1S48eYeWbyKgclcJr2D/dnwtfXZ7km8
qOeUiXBysP/VEUrt//LurIGJXCdSWxeHu4JW1ZnS0Ph8XOKloIecSe39w/murYdvbRU+Qyc=
Eu também tenho um arquivo gzip de 312 bytes da letra, construído a partir do mesmo fluxo DEFLATE. Suponho que você possa chamá-lo de "script zcat". :)