Correlação entre X e XY


11

Se eu tenho duas variáveis ​​aleatórias independentes X e Y, qual é a correlação entre X e o produto XY? Se isso for desconhecido, eu estaria interessado em saber pelo menos o que acontece no caso específico de X e Y serem normais com média zero, se isso for mais fácil de resolver.


4
O que motiva essa pergunta? Gostaria de saber se seria melhor também abordarmos outra coisa aqui. Você está conduzindo um estudo no qual criou uma variável XY por algum motivo?
gung - Restabelece Monica

Respostas:


13

Solução

Tomo-se que uma solução válida será um que expresse - se possível - a correlação em termos das propriedades distintas das variáveis e . Calculando a correlação vai envolver computar as covariâncias de monomios em e . É econômico fazer isso de uma só vez. Simplesmente observe queXYXY

  1. Quando e Y são independentes e i e j são potências, X i e Y j são independentes;XYijXiYj

  2. A expectativa de um produto de variáveis ​​independentes é o produto de suas expectativas.

Isto irá dar fórmulas em termos dos momentos de e Y .XY

É tudo o que há para isso.


Detalhes

Escrever , etc, para os momentos. Assim, para quaisquer números para os quais os cálculos façam sentido e produzam números finitos,μi(X)=E(Xi)i,j,k,l

Cov(XiYj,XkYl)=E(XiYjXkYl)E(XiYj)E(XkYl)=μi+k(X)μj+l(Y)μi(X)μk(X)μj(Y)μl(Y).

Observe que a variação de qualquer variável aleatória é sua covariância consigo mesma, portanto, não precisamos fazer nenhum cálculo especial para as variações.

Agora deve ser óbvio como calcular momentos envolvendo monômios, de quaisquer poderes, de qualquer número finito de variáveis ​​aleatórias independentes. Como aplicação, aplique esse resultado à definição de correlação, que é a covariância dividida pelas raízes quadradas das variações:

Cor(X,XY)=Cov(X1Y0,X1Y1)Cov(X1Y0,X1Y0) Cov(X1Y1,X1Y1)=μ2(X)μ1(Y)μ1(X)2μ1(Y)(μ2(X)μ1(X)2)(μ2(X)μ2(Y)μ1(X)2μ2(Y)2).

Existem várias simplificações algébricas que você pode escolher se desejar relacionar isso com expectativas, variações e covariâncias das variáveis ​​originais, mas realizá-las aqui não forneceria mais informações.


14

Usando a lei da covariância total e da independência de e , Usando a lei da variação total e, novamente, a independência, Observe comoXY

Cov(X,XY)=ECov(X,XY|Y)+Cov(EX|Y,EXY|Y)=E(YCov(X,X))+Cov(EX,YEX)=E(YVarX)+Cov(EX,YEX)=EYVarX.
Var(XY)=EVar(XY|Y)+VarE(XY|Y)=E(Y2(VarX|Y))+Var(Y(EX|Y))=E(Y2VarX)+Var(YEX)=E(Y2)VarX+(EX)2VarY=VarXVarY+(EY)2VarX+(EX)2VarY.
Y pode ser tratado como uma constante em qualquer uma das expectativas, variações ou covariâncias condicionais internas acima.

A partir da covariância e variância acima, a correlação pode, após algumas manipulações algébricas, ser bem expressa em termos dos dois coeficientes de variação como

corr(X,XY)=11+VarY(EY)2(1+(EX)2VarX).

Uma verificação deste resultado por simulação:

> n <- 1e+6
> x <- rexp(n,2)-2
> y <- rnorm(n,mean=5)
> cv2 <- function(x) var(x)/mean(x)^2
> 1/sqrt(1+cv2(y)*(1+1/cv2(x)))
[1] 0.844882
> cor(x,x*y)
[1] 0.8445373

Bom, mas eu gostaria de destacar algumas coisas: 1. Na terceira linha do segundo conjunto de equações, deve haver um parêntese como em ? 2. Você tem certeza de que a pessoa que fez a pergunta segue o raciocínio por trás das diferentes etapas? Por exemplo, é assim porque é um dado. Eu sugeriria uma explicação mínima para algumas das etapas. E(Y2VarX)+Var(YEX)ECov(X,XY|Y)=EYCov(X,X)Y
Antoni Parellada

1
Sim, adicionei alguns parênteses que estavam faltando e algumas explicações. Devo admitir que prefiro a resposta do @whuber.
Jarle Tufto 21/07

5

No caso específico de X e Y serem variáveis ​​aleatórias com média zero, então porque . Portanto,ρ(XY,X)=0E(X2Y)=E[E[X2Y|X]]=E[X2E[Y|X]]=0cov(XY,X)=E(X2Y)E(XY).E(X)=0


-2

A correlação linear entre X e XY será,

Corr (X, XY) = Cov (X, XY) / sqrt (var (X) * var (XY))

Cov (X, XY) = Somatório ((média X (X)) (média XY (XY)) / n

n - tamanho da amostra; var (X) = variância de X; var (XY) = variação de XY


1
A questão é sobre variáveis ​​aleatórias , não sobre dados.
whuber

como podemos descobrir se duas variáveis ​​aleatórias estão correlacionadas ou não? Através de dados apenas para a direita. Corrija-me se eu estiver errado. Desculpas.
Sam Gladio

Computa-se a correlação teoricamente, usando propriedades matemáticas de variáveis ​​aleatórias. É praticamente o mesmo que, digamos, calcular a força de um projeto de ponte usando os princípios da mecânica newtoniana, em comparação com a construção de pontes e testá-las: existem papéis distintos para a teoria e os dados e eles não devem ser confundidos um com o outro .
whuber
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.