Contexto: Em resposta a uma pergunta anterior sobre pesquisa reproduzível, Jake escreveu
Um problema que descobrimos ao criar nosso arquivo JASA foi que as versões e padrões dos pacotes CRAN foram alterados. Portanto, nesse arquivo, também incluímos as versões dos pacotes que usamos. O sistema baseado em vinheta provavelmente será interrompido quando as pessoas mudarem seus pacotes (não sabe como incluir pacotes extras no pacote que é o Compêndio).
Finalmente, eu me pergunto sobre o que fazer quando o próprio R muda. Existem maneiras de produzir, digamos, uma máquina virtual que reproduza todo o ambiente computacional usado para um papel, de modo que a máquina virtual não seja enorme?
Questão:
- Quais são as boas estratégias para garantir que a análise de dados reproduzíveis seja reproduzível no futuro (digamos, cinco, dez ou vinte anos após a publicação)?
- Especificamente, quais são as boas estratégias para maximizar a reprodutibilidade contínua ao usar Sweave e R?
Isso parece estar relacionado à questão de garantir que um projeto de análise de dados reproduzível seja executado na máquina de outra pessoa com padrões, pacotes etc. ligeiramente diferentes.