Modelos penalizados podem ser usados para estimar modelos em que o número de parâmetros é igual ou até maior que o tamanho da amostra. Essa situação pode surgir em modelos log-lineares de grandes tabelas esparsas de dados categóricos ou de contagem. Nessas configurações, geralmente também é desejável ou útil recolher tabelas combinando níveis de um fator em que esses níveis não são distinguíveis em termos de como eles interagem com outros fatores. Duas questões:
- Existe uma maneira de usar modelos penalizados, como LASSO ou rede elástica, para testar a capacidade de recolhimento de níveis dentro de cada fator?
- Se a resposta para a primeira pergunta for afirmativa, pode e deve ser configurada de tal maneira que o colapso dos níveis e a estimativa dos coeficientes do modelo ocorram em uma única etapa?