Este é um comentário mais extenso, portanto, tome-o como tal. Defina:
(estou usando a notação padrão para distribuições gaussianas).
f(x)≡1n∑i=1nN(x|xi,σ2i)
Você quer provar que:
que é
{1
1n∑i=1nlogf(xi)−∫f(x)logf(x)dx≥0
{1n∑i=1nlogf(xi)}+H[f]≥0.
Devido à desigualdade de Jensen (ver, por exemplo, Huber et al., On Entropy Approximation for Gaussian Mixture Random Vectors, 2008 ),
comgi(x)≡1
H[f]≥−1n∑i=1nlog∫f(x)N(x|xi,σ2i)dx=−1n∑i=1nloggi(xi)
, que vem da convolução de duas densidades gaussianas. Então temos:
{1gEu( x ) ≡ 1n∑nj = 1N( x | xj, σ2Eu+ σ2j)
Curiosamente, o
giainda são misturas de Gaussianas com meios de componentes iguais aos da
f, mas cada componente de
gitem uma variância estritamente maior do que o seu correspondente componente em
f. Você pode fazer alguma coisa com isso?
{ 1n∑i = 1nregistrof( xEu) } + H [ f] ≥ 1n∑i = 1nregistrof( xEu)gEu( xEu).
gEufgEuf