Eu tenho um conjunto de dados com três variáveis, onde todas as variáveis são quantitativas. Vamos chamá-lo de , e . Estou ajustando um modelo de regressão em uma perspectiva bayesiana via MCMC comx 1 x 2rjags
Fiz uma análise exploratória e o gráfico de dispersão de sugere que um termo quadrático deve ser usado. Então eu montei dois modelos
(1)
(2)
No modelo 1, o tamanho do efeito de cada parâmetro não é pequeno e o intervalo credível de 95% não contém o valor .
No modelo 2, o tamanho do efeito dos parâmetros e é pequeno e cada um dos intervalos credíveis para todos os parâmetros contém .β 4 0
O fato de um intervalo credível conter é suficiente para dizer que o parâmetro não é significativo?
Então eu ajustei o seguinte modelo
(3)
O tamanho do efeito de cada parâmetro não é pequeno, mas com exceção de todos os intervalos credíveis contêm . 0
Qual é o caminho certo para fazer a seleção de variáveis nas estatísticas bayesianas?
Edição: Eu posso usar Lasso em qualquer modelo de regressão, como o modelo Beta? Estou usando um modelo com dispersão variável em que que é um vetor. Também devo usar o Laplace antes em ?δ
EDIT2: Eu dois modelos, um com gaussiana para , e outro com Laplace (exponencial duplo).δ j
As estimativas para o modelo gaussiano são
Mean SD Naive SE Time-series SE
B[1] -1.17767 0.07112 0.0007497 0.0007498
B[2] -0.15624 0.03916 0.0004128 0.0004249
B[3] 0.15600 0.05500 0.0005797 0.0005889
B[4] 0.07682 0.04720 0.0004975 0.0005209
delta[1] -3.42286 0.32934 0.0034715 0.0034712
delta[2] 0.06329 0.27480 0.0028966 0.0028969
delta[3] 1.06856 0.34547 0.0036416 0.0036202
delta[4] -0.32392 0.26944 0.0028401 0.0028138
As estimativas para o modelo Lasso são
Mean SD Naive SE Time-series SE
B[1] -1.143644 0.07040 0.0007421 0.0007422
B[2] -0.160541 0.05341 0.0005630 0.0005631
B[3] 0.137026 0.05642 0.0005947 0.0005897
B[4] 0.046538 0.04770 0.0005028 0.0005134
delta[1] -3.569151 0.27840 0.0029346 0.0029575
delta[2] -0.004544 0.15920 0.0016781 0.0016786
delta[3] 0.411220 0.33422 0.0035230 0.0035629
delta[4] -0.034870 0.16225 0.0017103 0.0017103
lambda 7.269359 5.45714 0.0575233 0.0592808
As estimativas para e reduziram muito no modelo Lasso, significa que devo remover essas variáveis do modelo?δ 4
EDIT3: O modelo com duplo exponencial anterior (Lasso) me fornece valores maiores de Deviance, BIC e DIC do que o modelo com anteriores gaussianos e até recebo valores menores depois de remover o coeficiente de dispersão no modelo gaussiano.