Se tivermos 2 variáveis aleatórias normais e não correlacionadas , podemos criar 2 variáveis aleatórias correlacionadas com a fórmula
e então terá uma correlação ρ com X 1 .
Alguém pode explicar de onde vem essa fórmula?
Se tivermos 2 variáveis aleatórias normais e não correlacionadas , podemos criar 2 variáveis aleatórias correlacionadas com a fórmula
e então terá uma correlação ρ com X 1 .
Alguém pode explicar de onde vem essa fórmula?
Respostas:
Suponha que você queira encontrar uma combinação linear de e X 2 de modo que
Observe que, se você multiplicar e β pela mesma constante (diferente de zero), a correlação não será alterada. Assim, vamos adicionar uma condição para preservar a variação: var ( α X 1 + β X 2 ) = var ( X 1 )
Isso é equivalente a
Assumindo que ambas as variáveis aleatórias tenham a mesma variância (essa é uma suposição crucial!) ( ), obtemos
Existem muitas soluções para essa equação, então é hora de recuperar a condição de preservação de variação:
E isso nos leva a
UPD . Em relação à segunda pergunta: sim, isso é conhecido como clareamento .
A equação é uma forma bivariada simplificada de decomposição de Cholesky . Essa equação simplificada às vezes é chamada de algoritmo de Kaiser-Dickman (Kaiser e Dickman, 1962).
Observe que e X 2 devem ter a mesma variação para que esse algoritmo funcione corretamente. Além disso, o algoritmo é normalmente usado com variáveis normais. Se X 1 ou X 2 não são normais, Y pode não ter a mesma forma distributiva como X 2 .
Referências:
Kaiser, HF e Dickman, K. (1962). Matrizes de pontuação de amostra e população e matrizes de correlação de amostra de uma matriz de correlação populacional arbitrária. Psychometrika, 27 (2), 179-182.
Correlation coefficient is the between two series if they are treated as vectors (with data point being dimension of a vector). The above formula simply creates a decomposition of a vector into its , components (with respect to ).
if ,
then .
Because if are uncorrelated, the angle between them is a right angle (ie, they can be considered as orthogonal, albeit non-normalized, basis vectors ).