Migrado e expandido de um comentário:
Eu acho que isso deve variar de acordo com o subcampo. Quase todas as coisas da Teoria B com as quais eu estou familiarizado (e especialmente Haskell, Agda e, por vezes, relacionadas à Coq) incluem código publicado, às vezes até como um apêndice ou, melhor ainda, descrito no artigo. Um bom número de artigos de, por exemplo, o ICFP são escritos como programas alfabetizados, e sua fonte na íntegra é publicada pelos autores. Uma boa quantidade desses, por sua vez, resultou em bibliotecas extraídas para distribuição.
Dos papéis restantes, uma quantidade razoável nunca teve código para começar. Dessas, provavelmente existem duas razões principais. Primeiro, são os artigos cujo conteúdo principal são árvores de prova, regras de digitação com provas de integridade associadas e similares. Desses, os avanços na metateoria mecanizada incentivaram pelo menos alguns autores a fornecer código em seu provador de teoremas preferido (veja os slides de Weirich no POPLmark: http://www.seas.upenn.edu/~sweirich/talks/cambridge-09. pdf) Em segundo lugar, são os que descendem do material das aves merteens (banannas & co.). Geralmente, eles são traduzíveis para um idioma funcional sem muito trabalho. No entanto, suspeito que exista uma perda geral de generalidade, e que lidar com questões concretas de sintaxe e digitação complica desnecessariamente as coisas e torna mais difícil seguir o raciocínio equacional.
Eu queria substanciar minhas observações um pouco, assim como uma contagem aproximada dos dois primeiros dias do ICFP 2010. Dos documentos padrão (ou seja, sem relatos de experiência ou palestras convidadas), 12 dos 21 forneceram algum tipo de código. Três forneceram Coq (um quarto reivindicou uma prova parcial, mas não a publicou). Três apoiaram Haskell. Três forneceram a Agda. Um forneceu Scheme, um forneceu Caml e um forneceu Twelf. (Observe que alguns forneceram código para mais de um assistente de prova ou para uma formalização e uma implementação). Dos trabalhos restantes, alguns trabalharam com um nível de abstração alto o suficiente para que implementá-lo em um assistente de prova fosse um trabalho novo em si, e um número razoável de outros trabalhos que eu suspeito que poderiam ter sido implementados em um assistente de prova usando técnicas padrão, mas que certamente exigiriam bastante trabalho para isso.