Me deparei com uma pergunta simples sobre a comparação de modelos flexíveis (ou seja, splines) versus modelos inflexíveis (por exemplo, regressão linear) em diferentes cenários. A questão é:
Em geral, esperamos que o desempenho de um método flexível de aprendizado estatístico tenha um desempenho melhor ou pior que um método inflexível quando:
- O número de preditores é extremamente grande e o número de observações é pequeno? n
- A variação dos termos do erro, ou seja, , é extremamente alta?
Penso em (1), quando é pequeno, modelos inflexíveis são melhores (não tenho certeza). Para (2), não sei qual modelo é (relativamente) melhor.