Pergunto-me, se há alguma heurística no número de características versus número de observações. Obviamente, se um número de recursos for igual ao número de observações, o modelo será super ajustado. Usando métodos esparsos (LASSO, rede elástica), podemos remover vários recursos para reduzir o modelo.
Minha pergunta é (teoricamente): antes de usarmos métricas para avaliar a seleção do modelo, existem observações empíricas que relacionam o número ideal de recursos ao número de observações?
Por exemplo: para um problema de classificação binária com 20 instâncias em cada classe, existe algum limite superior no número de recursos a serem usados?