Os requisitos desses tipos de perguntas me parecem um pouco bizarros. Aqui está um conceito / fórmula matemática , mas quero falar sobre isso em algum contexto completamente desprovido de símbolos matemáticos. Eu também acho que deveria ser afirmado que a álgebra real necessária para entender as fórmulas, eu pensaria, deveria ser ensinada à maioria das pessoas antes do ensino superior (não é necessário entender a álgebra matricial, apenas álgebra simples será suficiente).
Portanto, a princípio, em vez de ignorar completamente a fórmula e falar sobre ela em alguns tipos de analogias mágicas e heurísticas, vamos apenas olhar para a fórmula e tentar explicar os componentes individuais em pequenos passos. A diferença em termos de covariância e correlação, ao examinar as fórmulas, deve ficar clara. Considerando que, falando em termos de analogias e heurísticas, suspeito que ocultem dois conceitos relativamente simples e suas diferenças em muitas situações.
Então, vamos começar com uma fórmula para a covariância da amostra (que acabei de pegar e adotar na wikipedia);
1n−1∑ni=1(xi−x¯)(yi−y¯)
Para manter todos atualizados, vamos definir explicitamente todos os elementos e operações na fórmula.
- e y i são medidas de dois atributos separados da mesma observaçãoxiyi
- e ˉ y são os meios (ou média) de cada atributox¯y¯
- Para , digamos que isso significa que dividimos o resultado final porn-1.1n - 1n - 1
- pode ser um símbolo estranho para alguns, por isso provavelmente seria útil para explicar esta operação. É simplesmente a soma de todos os i separar observações, e n representa o número total de observações.∑ni = 1Eun
Neste ponto, eu poderia apresentar um exemplo simples, para colocar um rosto nos elementos e operações, por assim dizer. Então, por exemplo, vamos criar uma tabela, em que cada linha corresponde a uma observação (e e y são rotulados adequadamente). É provável que esses exemplos sejam mais específicos (por exemplo, digamos que x representa idade e y representa peso), mas, para nossa discussão aqui, isso não deve importar.xyxy
x y
---
2 5
4 8
9 3
5 6
0 8
Nesse ponto, se você sentir que a operação de soma na fórmula pode não ter sido totalmente compreendida, é possível apresentá-la novamente em um contexto muito mais simples. Diga apenas apresente que é o mesmo que dizer neste exemplo;∑ni = 1( xEu)
x
--
2
4
9
5
+ 0
--
20
Agora que bagunça deve ser esclarecido, e podemos trabalhar nosso caminho para a segunda parte da fórmula, . Agora, supondo que as pessoas já sabem que a média, ˉ x e ° y representam, e eu diria que, sendo hipócrita dos meus próprios comentários no início do post, pode-se apenas se referem à média em termos de heurísticas simples (por exemplo, no meio da distribuição). Pode-se então apenas executar esse processo, uma operação de cada vez. A declaração ( x i - ˉ x )( xEu- x¯) ( yEu- y¯)x¯y¯( xEu- x¯)está apenas examinando os desvios / distâncias entre cada observação e a média de todas as observações para esse atributo específico. Portanto, quando uma observação estiver mais distante da média, essa operação receberá um valor mais alto. Pode-se então voltar à tabela de exemplo fornecida e simplesmente demonstrar a operação no vetor das observações.x
x x_bar (x - x_bar)
2 4 -2
4 4 0
9 4 5
5 4 1
0 4 -4
A operação é a mesma para o vetor , mas apenas para reforço, você também pode apresentar essa operação.y
y y_bar (y - y_bar)
5 6 -1
8 6 2
3 6 -3
6 6 0
8 6 2
( xEu- x¯)( yEu- y¯)( xEu- x¯) ⋅ ( yEu- y¯)
Observe o que acontece ao multiplicar, se duas observações estiverem a uma grande distância acima da média, a observação resultante terá um valor positivo ainda maior (o mesmo acontece se as duas observações estiverem a uma grande distância abaixo da média, como multiplicar dois negativos é igual a positivo). Observe também que se uma observação estiver alta acima da média e a outra estiver bem abaixo da média, o valor resultante será grande (em termos absolutos) e negativo (como um tempo positivo, um negativo é igual a um número negativo). Por fim, observe que, quando um valor estiver muito próximo da média para qualquer observação, multiplicar os dois valores resultará em um número pequeno. Novamente, podemos apenas apresentar esta operação em uma tabela.
(x - x_bar) (y - y_bar) (x - x_bar)*(y - y_bar)
-2 -1 2
0 2 0
5 -3 -15
1 0 0
-4 2 -8
n - 1
(x - x_bar)*(y - y_bar)
-----------------------
2
0
-15
0
+ -8
-----
-21
-21/(5-1) = -5.25
Nesse ponto, convém reforçar de onde os 5 vêm, mas isso deve ser tão simples quanto voltar à tabela e contar o número de observações (vamos deixar novamente a diferença entre amostra e população para outra hora).
ρ
ρ = Co v ( x , y)Va r ( x ) Va r ( y)√
Co v ( x , x ) = Va r ( x )) E todos os mesmos conceitos que você introduziu com a covariância se aplicam (ou seja, se uma série tiver muitos valores muito longe de sua média, ela terá uma alta variação). Talvez observe aqui que uma série também não pode ter uma variação negativa (que deve logicamente seguir a matemática apresentada anteriormente).
Va r ( x ) Va r ( y)Va r ( x ) Va r ( y)-----------√
Entendo que, em algumas circunstâncias, esse nível de tratamento não seria apropriado. O Senado precisa do resumo executivo . Nesse caso, bem, você pode se referir às heurísticas simples que as pessoas têm usado em outros exemplos, mas Roma não foi construída em um dia. E ao senado que pede o resumo executivo, se você tiver tão pouco tempo, talvez deva apenas aceitar minha palavra e dispensar as formalidades de analogias e pontos de bala.