Isso não resulta em excesso de ajuste? Meus resultados seriam mais confiáveis se eu adicionasse um procedimento de canivete ou bootstrap como parte da análise?
Isso não resulta em excesso de ajuste? Meus resultados seriam mais confiáveis se eu adicionasse um procedimento de canivete ou bootstrap como parte da análise?
Respostas:
Eu acho que construir um modelo e testá-lo são coisas diferentes. A eliminação para trás faz parte da construção do modelo. Jack knife e bootstrap são mais usados para testá-lo.
Certamente, é possível ter estimativas mais confiáveis com o bootstrap e o jack knife do que com a simples eliminação para trás. Mas se você realmente deseja testar o overfitting, o teste final é uma amostra dividida, treinamento em alguns, testes em outros. Deixar um fora é muito instável / não é confiável para esse fim: http://www.russpoldrack.org/2012/12/the-perils-of-leave-one-out.html
Acho que pelo menos 10% dos sujeitos precisam sair para obter estimativas mais estáveis de robustez do modelo. E se você tem 20 assuntos, 2 assuntos ainda são muito poucos. Mas então a questão passa a ser se você tem uma amostra grande o suficiente para construir um modelo que possa ser aplicado ao restante da população.
Espero que tenha respondido sua pergunta, pelo menos em parte.