Todos nós estamos familiarizados com a noção, bem documentada na literatura, de que a otimização do LASSO (por uma questão de simplicidade limita a atenção aqui ao caso da regressão linear)
Considere que, do ponto de vista bayesiano, podemos calcular a probabilidade posterior de que, digamos, as estimativas de parâmetros diferentes de zero estejam em qualquer coleção de intervalos e os parâmetros definidos como zero pelo LASSO sejam iguais a zero. O que me confundiu é que, como o prior de Laplace é contínuo (na verdade, absolutamente contínuo), então como pode haver massa em qualquer conjunto que é produto de intervalos e singletons em ?