Realizei uma avaliação baseada em computador de diferentes métodos de ajuste de um tipo específico de modelo usado nas ciências paleo. Eu tinha um conjunto de treinamento amplo e, por isso, aleatoriamente (amostragem aleatória estratificada), anotei um conjunto de testes. Ajustei métodos diferentes às amostras do conjunto de treinamento e, usando os m modelos resultantes, previ a resposta para as amostras do conjunto de teste e calculei um RMSEP sobre as amostras no conjunto de teste. Esta é uma corrida única .
Repeti esse processo várias vezes, cada vez que escolhi um conjunto de treinamento diferente, amostrando aleatoriamente um novo conjunto de testes.
Depois de fazer isso, quero investigar se algum dos métodos tem desempenho RMSEP melhor ou pior. Eu também gostaria de fazer várias comparações dos métodos aos pares.
Minha abordagem foi ajustar um modelo linear de efeitos mistos (LME), com um único efeito aleatório para Run . Eu usei lmer()
no pacote lme4 para ajustar meu modelo e funções do pacote multcomp para executar várias comparações. Meu modelo era essencialmente
lmer(RMSEP ~ method + (1 | Run), data = FOO)
onde method
é um fator que indica qual método foi usado para gerar as previsões do modelo para o conjunto de testes e Run
é um indicador para cada execução específica do meu "experimento".
Minha pergunta é em relação aos resíduos da LME. Dado o único efeito aleatório da execução , estou assumindo que os valores de RMSEP para essa execução estejam correlacionados até certo ponto, mas não estejam correlacionados entre as execuções, com base na correlação induzida que o efeito aleatório fornece.
Essa suposição de independência entre as execuções é válida? Se não, existe uma maneira de explicar isso no modelo LME ou devo procurar outro tipo de análise estática para responder à minha pergunta?