Para adicionar as excelentes respostas de Carlos e Xi'an , também é interessante notar que uma condição suficiente para que a divergência de KL seja finita é que ambas as variáveis aleatórias tenham o mesmo suporte compacto e que a densidade de referência seja limitada . Esse resultado também estabelece um limite implícito para o máximo da divergência de KL (consulte o teorema e a prova abaixo).
Teorema: Se as densidades e q têm o mesmo suporte compacto X e a densidade p é delimitada nesse suporte (ou seja, possui um limite superior finito), então K L ( P | | Q ) < ∞ .pqXpKL(P||Q)<∞
Prova: Como possui suporte compacto X, isso significa que há algum valor positivo positivo:qX
q–≡infx∈Xq(x)>0.
Da mesma forma, como possui suporte compacto X, isso significa que há algum valor supremo positivo:pX
p¯≡supx∈Xp(x)>0.
Além disso, como essas duas densidades estão no mesmo suporte e o último é limitado, temos . Isso significa que:0<q–⩽p¯<∞
supx∈Xln(p(x)q(x))⩽ln(p¯)−ln(q–).
Agora, deixando ser o último limite superior, que têm claramente assim naquela:0⩽ L _ <∞L––≡ln(p¯)−ln(q–)0⩽L––<∞
KL(P||Q)=∫Xln(p(x)q(x))p(x)dx⩽supx∈Xln(p(x)q(x))∫Xp(x)dx⩽(ln(p¯)−ln(q–))∫Xp(x)dx=L––<∞.
Isso estabelece o limite superior necessário, o que prova o teorema. ■