Meu colega e eu estamos ajustando uma variedade de modelos de efeitos mistos lineares e não-lineares em R. Somos solicitados a realizar validação cruzada nos modelos ajustados, para que se possa verificar se os efeitos observados são relativamente generalizáveis. Normalmente, essa é uma tarefa trivial, mas, no nosso caso, precisamos dividir os dados em uma parte de treinamento e uma parte de teste (para fins de CV) que não compartilham níveis comuns. Por exemplo,
Os dados do treinamento podem ser baseados nos Grupos 1,2,3,4; O modelo ajustado é validado cruzadamente no Grupo 5.
Portanto, isso cria um problema, pois os efeitos aleatórios baseados em grupo estimados nos dados de treinamento não se aplicam aos dados de teste. Portanto, não podemos CV do modelo.
Existe uma solução relativamente simples para isso? Ou alguém já escreveu um pacote para resolver esse problema? Qualquer dica é bem-vinda!
Obrigado!