Intuição por trás da fórmula para a variação de uma soma de duas variáveis


10

Eu sei de estudos anteriores que

Var(A+B)=Var(A)+Var(B)+2Cov(A,B)

No entanto, não entendo por que isso acontece. Percebo que o efeito será "aumentar" a variação quando A e B covarem altamente. Faz sentido que, ao criar um composto a partir de duas variáveis ​​altamente correlacionadas, você tenderá a adicionar as observações altas de A com as altas observações de B e as baixas observações de A com as baixas observações de B. Isso tenderá a crie valores extremos altos e baixos na variável composta, aumentando a variação do composto.

Mas por que funciona multiplicar a covariância por exatamente 2?


11
Se e estão perfeitamente correlacionados positivamente, então e se eles estão perfeitamente correlacionados negativamente, então . As medidas de covariância como distante ao longo desta faixa a sua relação éABVar(A+B)=Var(A)+Var(B)+2Var(A)Var(B)Var(A+B)=Var(A)+Var(B)2Var(A)Var(B)
Henry

Respostas:


21

Resposta simples:

A variação envolve um quadrado:

Var(X)=E[(XE[X])2]

Portanto, sua pergunta se resume ao fator 2 na identidade do quadrado:

(a+b)2=a2+b2+2ab

O que pode ser entendido visualmente como uma decomposição da área de um quadrado do lado na área dos quadrados menores dos lados e , além de dois retângulos dos lados e :(a+b)abab

insira a descrição da imagem aqui

Resposta mais envolvida:

Se você deseja uma resposta matematicamente mais envolvida, a covariância é uma forma bilinear, o que significa que é linear tanto no primeiro quanto no segundo argumento, isso leva a:

Var(A+B)=Cov(A+B,A+B)=Cov(A,A+B)+Cov(B,A+B)=Cov(A,A)+Cov(A,B)+Cov(B,A)+Cov(B,B)=Var(A)+2Cov(A,B)+Var(B)

Na última linha, usei o fato de que a covariância é simétrica:

Cov(A,B)=Cov(B,A)

Resumindo:

São dois porque você deve considerar tanto quanto .cov(A,B)cov(B,A)


5

O conjunto de variáveis ​​aleatórias é um espaço vetorial, e muitas das propriedades do espaço euclidiano podem ser analogas a elas. O desvio padrão atua como um comprimento e a variação como comprimento ao quadrado. A independência corresponde a ser ortogonal, enquanto a correlação perfeita corresponde à multiplicação escalar. Assim, a variância das variáveis ​​independentes segue o Teorema de Pitágoras: .
var(A+B)=var(A)+var(B)

Se eles estão perfeitamente correlacionados, então
std(A+B)=std(A)+std(B)

Observe que isso é equivalente a
var(A+B)=var(A)+var(B)+2var(A)var(B)

Se eles não são independentes, seguem uma lei análoga à lei dos cossenos:
var(A+B)=var(A)+var(B)+2cov(A,B)

Observe que o caso geral é um entre independência completa e correlação perfeita. Se e são independentes, então é zero. Assim, o caso geral é que tem sempre uma prazo e um prazo, e então ele tem alguma variação no prazo ; quanto mais correlacionadas as variáveis, maior será o terceiro termo. E isso é precisamente o que é: é vezes o de e .ABcov(A,B)var(A,B)var(A)var(B)2var(A)var(B)2cov(A,B)2var(A)var(B)r2AB

var(A+B)=var(A)+var(B)+MeasureOfCorrelationPerfectCorrelationTerm

onde eMeasureOfCorrelation=r2PerfectCorrelationTerm=2var(A)var(B)

Coloque em outros termos, se , entãor=correl(A,B)

σA+B=σA2+σB2+2(rσA)(rσB)

Assim, é análogo ao na Lei dos Cossenos.r2cos


2

Eu acrescentaria que o que você citou não é a definição de , mas uma conseqüência das definições de e . Portanto, a resposta para o porquê dessa equação é o cálculo realizado pela byouness . Sua pergunta pode realmente ser por que isso faz sentido; informalmente:Var(A+B)VarCov

Quanto "variará" depende de quatro fatores:A+B

  1. Quanto varia por si só.A
  2. Quanto varia por si só.B
  3. Quanto varia conforme se move (ou varia).AB
  4. Quanto varia conforme se move.BA

O que nos leva a porque é um operador simétrico.

Var(A+B)=Var(A)+Var(B)+Cov(A,B)+Cov(B,A)
=Var(A)+Var(B)+2Cov(A,B)
Cov
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.