A variação é o segundo momento menos o quadrado do primeiro momento; portanto, basta calcular os momentos das misturas.
Em geral, dadas as distribuições com PDFs e pesos constantes (não aleatórios) p i , o PDF da mistura éfipi
f(x)=∑ipifi(x),
do qual resulta imediatamente para qualquer momento quek
μ(k)=Ef[xk]=∑ipiEfi[xk]=∑ipiμ(k)i.
Escrevi para o momento k t h de f e μ ( k ) i para o momento k t h de f i .μ(k)kthfμ(k)ikthfi
Usando essas fórmulas, a variação pode ser escrita
Var(f)=μ(2)−(μ(1))2=∑ipiμ(2)i−(∑ipiμ(1)i)2.
Equivalentemente, se as variações de são dadas como σ 2 i , então μ ( 2 ) i = σ 2 i + ( μ ( 1 ) i ) 2 , permitindo que a variação da mistura f seja escrita em termos de variações e meios de seus componentes comofiσ2iμ( 2 )Eu= σ2Eu+ ( μ( 1)Eu)2f
Var ( f)= ∑EupEu(σ2i+(μ(1)i)2)−(∑ipiμ(1)i)2=∑ipiσ2i+∑ipi(μ(1)i)2−(∑ipiμ(1)i)2.
Em palavras, essa é a variação média (ponderada) mais a média quadrática média menos o quadrado da média média. Como o quadrado é uma função convexa, a Desigualdade de Jensen afirma que a média quadrática média não pode ser menor que o quadrado da média média. Isso nos permite entender a fórmula como declarar que a variação da mistura é a mistura das variações mais um termo não negativo que explica a dispersão (ponderada) dos meios.
No seu caso, a variação é
pAσ2A+pBσ2B+[pAμ2A+pBμ2B−(pAμA+pBμB)2].
Podemos interpretar que essa é uma mistura ponderada das duas variâncias, , mais um termo de correção (necessariamente positivo) para levar em conta as mudanças das médias individuais em relação à média geral da mistura.pAσ2A+pBσ2B
A utilidade dessa variação na interpretação dos dados, como a apresentada na pergunta, é duvidosa, porque a distribuição da mistura não será Normal (e pode se afastar substancialmente dela, na medida em que a bimodalidade seja exibida).