Pergunta: Quais são as vantagens / desvantagens de usar um anterior sobre o outro para a seleção de variáveis?
Suponha que eu tenha a probabilidade: onde eu posso colocar qualquer um dos anteriores: w i ∼ π δ 0 + ( 1 - π ) N ( 0 , 100 )
Coloquei para enfatizar que a maioria dos pesos é zero e uma gama anterior em λ para escolher o parâmetro 'regularizing'.
No entanto, meu professor continua insistindo que a versão do laço 'encolhe' os coeficientes e não está realmente fazendo a seleção adequada das variáveis, ou seja, há um encolhimento excessivo até dos parâmetros relevantes.