Seleção de características em um modelo linear generalizado hierárquico bayesiano


8

Pretendo estimar um GLM hierárquico, mas com a seleção de recursos para determinar quais covariáveis ​​são relevantes no nível da população a serem incluídas.

Suponha que eu tenha grupos com observações e possíveis covariáveis ​​Ou seja, possuo uma matriz de design de covariáveis \ boldsymbol {x} _ {(N \ cdot G) \ vezes K} , resultados \ boldsymbol {y} _ {(N \ cdot G) \ times 1} . Os coeficientes dessas covariáveis ​​são \ beta_ {K \ times 1} .N K x ( N G ) × K y ( N G ) × 1 β K × 1GNKx(NG)×Ky(NG)×1βK×1

Suponha que Y ~ Bernoulli(p(x,β))

A seguir, é apresentado um GLM bayesiano hierárquico padrão com modelo de amostragem logit e coeficientes de grupo normalmente distribuídos.

eu(y|x,β1,...βG)g=1Gt=1N(Pr{j=1|pt,βg})yg,t(1-Pr{j=1|pt,βg})1-yg,t

β1,...βG|μ,ΣEuEudNd(μ,Σ)

μ|ΣN(μ0 0,uma-1Σ)
ΣEuW(v0 0,V0 0-1)

Quero modificar esse modelo (ou encontrar um documento que o faça, ou trabalhe que o discuta) de tal maneira que exista alguma seleção nítida de recursos (como no LASSO) sobre a dimensionalidade de β .

(1) A maneira mais simples e direta seria regularizá-la no nível populacional, de modo a restringirmos essencialmente a dimensionalidade de e todos tenham a mesma dimensão.μβ

(2) O modelo com mais nuances teria encolhimento no nível do grupo, onde a dimensão de depende da unidade hierárquica.β

Estou interessado em resolver 1 e 2, mas muito mais importante é 1.

Respostas:


1

A maneira como abordaria (1) envolveria um modelo de espigão e laje, algo como:

βg,k=zkmg,k

zkBern(p)

mg,kN(μ,Σ)

μ,ΣNEuWv0 0(μ0 0,V0 0-1)

Este:

  • Mantém a flexibilidade nos 's do NIW anterior em .βμ,Σ
  • Modela a seleção de variáveis ​​para todos os grupos de uma só vez.
  • Facilmente extensível adicionando um sub-índice para o grupo a e tendo um beta comum anterior para cada local .zg,kk

Claro, acho que esse é o tipo de problema em que existem várias abordagens válidas.


2

A seleção de recursos não é um grande objetivo a ter em uma análise. A menos que todos os preditores não estejam correlacionados e o tamanho da amostra seja imenso, os dados não conseguirão fornecer a resposta com segurança. A especificação do modelo é mais importante que a seleção do modelo. Os detalhes estão nas minhas Notas do curso RMS . Mas o encolhimento, sem a seleção de recursos (por exemplo, crista ou estimativa de probabilidade máxima penalizada ) pode ser uma boa idéia. Os modelos bayesianos hierárquicos são ainda melhores porque permitem inferência estatística no modelo encolhido, enquanto perdemos a maioria das ferramentas inferenciais no mundo freqüentista após encolher.eu2

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.