Pretendo estimar um GLM hierárquico, mas com a seleção de recursos para determinar quais covariáveis são relevantes no nível da população a serem incluídas.
Suponha que eu tenha grupos com observações e possíveis covariáveis Ou seja, possuo uma matriz de design de covariáveis \ boldsymbol {x} _ {(N \ cdot G) \ vezes K} , resultados \ boldsymbol {y} _ {(N \ cdot G) \ times 1} . Os coeficientes dessas covariáveis são \ beta_ {K \ times 1} .N K x ( N ⋅ G ) × K y ( N ⋅ G ) × 1 β K × 1
Suponha que ~
A seguir, é apresentado um GLM bayesiano hierárquico padrão com modelo de amostragem logit e coeficientes de grupo normalmente distribuídos.
Quero modificar esse modelo (ou encontrar um documento que o faça, ou trabalhe que o discuta) de tal maneira que exista alguma seleção nítida de recursos (como no LASSO) sobre a dimensionalidade de .
(1) A maneira mais simples e direta seria regularizá-la no nível populacional, de modo a restringirmos essencialmente a dimensionalidade de e todos tenham a mesma dimensão.
(2) O modelo com mais nuances teria encolhimento no nível do grupo, onde a dimensão de depende da unidade hierárquica.
Estou interessado em resolver 1 e 2, mas muito mais importante é 1.