O problema com sua linha de raciocínio é
"Acho que sempre podemos assumir que é independente dos outros X ".XX
não é independente do X . O símbolo X está sendo usado para se referir à mesma variável aleatória aqui. Depois que você souber o valor do primeiro X a aparecer na sua fórmula, isso também corrigirá o valor do segundo X a aparecer. Se você deseja que eles se refiram a variáveis aleatórias distintas (e potencialmente independentes), é necessário denotá-las com letras diferentes (por exemplo, X e Y ) ou usando subscritos (por exemplo, X 1 e X 2 ); o último é frequentemente (mas nem sempre) usado para denotar variáveis extraídas da mesma distribuição.XXXXXXYX1X2
Se duas variáveis e Y são independentes, então Pr ( X = um | Y = b ) é o mesmo que Pr ( X = um ) : conhecendo o valor de Y não nos dá qualquer informação adicional sobre o valor de X . Mas Pr ( X = um | X = b ) é 1 se a = b e 0 em contrário: conhecer o valor de XXYPr(X=a|Y=b)Pr(X=a)YXPr(X=a|X=b)1a=b0Xdá-lhe informações completas sobre o valor de . [Você pode substituir as probabilidades neste parágrafo por funções de distribuição cumulativa ou, quando apropriado, funções de densidade de probabilidade, para essencialmente o mesmo efeito.]X
Outra maneira de ver as coisas é que, se duas variáveis são independentes, elas têm correlação zero (embora a correlação zero não implique independência !), Mas está perfeitamente correlacionado consigo mesmo, Corr ( X , X ) = 1 para que X não possa ser independente de si mesmo. Observe que, como a covariância é dada por Cov ( X , Y ) = Corr ( X , Y ) √XCorr(X,X)=1X , entãoCov(X,X)=1 √Cov(X,Y)=Corr(X,Y)Var(X)Var(Y)−−−−−−−−−−−−√
Cov(X,X)=1Var(X)2−−−−−−−√=Var(X)
A fórmula mais geral para a variação de uma soma de duas variáveis aleatórias é
Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)
Em particular, , entãoCov(X,X)=Var(X)
Var(X+X)=Var(X)+Var(X)+2Var(X)=4Var(X)
que é o mesmo que você deduziria da aplicação da regra
Var(aX)=a2Var(X)⟹Var(2X)=4Var(X)
Se você estiver interessado em linearidade, poderá estar interessado na bilinearidade da covariância. Para variáveis aleatórias , X , Y e Z (dependentes ou independentes) e constantes a , b , c e d , temosWXYZabcd
Cov(aW+bX,Y)=aCov(W,Y)+bCov(X,Y)
Cov(X,cY+dZ)=cCov(X,Y)+dCov(X,Z)
e no geral,
Cov(aW+bX,cY+dZ)=acCov(W,Y)+adCov(W,Z)+bcCov(X,Y)+bdCov(X,Z)
You can then use this to prove the (non-linear) results for variance that you wrote in your post:
Var(aX)=Cov(aX,aX)=a2Cov(X,X)=a2Var(X)
Var(aX+bY)Var(aX+bY)=Cov(aX+bY,aX+bY)=a2Cov(X,X)+abCov(X,Y)+baCov(X,Y)+b2Cov(Y,Y)=a2Var(X)+b2Var(Y)+2abCov(X,Y)
The latter gives, as a special case when a=b=1,
Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)
When X and Y are uncorrelated (which includes the case where they are independent), then this reduces to Var(X+Y)=Var(X)+Var(Y).
So if you want to manipulate variances in a "linear" way (which is often a nice way to work algebraically), then work with the covariances instead, and exploit their bilinearity.