Os alunos do ensino médio podem ver as fórmulas de correlação PMCC e Spearman anos antes de terem as habilidades de álgebra para manipular a notação sigma, embora possam conhecer bem o método das diferenças finitas para deduzir a equação polinomial de uma sequência . Portanto, tentei escrever uma "prova do ensino médio" para a equivalência: encontrar o denominador usando diferenças finitas e minimizar a manipulação algébrica de somas no numerador. Dependendo dos alunos aos quais a prova é apresentada, você pode preferir essa abordagem ao numerador, mas combine-a com um método mais convencional para o denominador.
Denominador ,∑i(xi−x¯)2∑i(yi−y¯)2−−−−−−−−−−−−−−−−−−−√
Sem vínculos, os dados estão nas fileiras em alguma ordem, portanto é fácil mostrar . Podemos reordenar a soma , embora em alunos de séries mais baixas eu provavelmente escrevesse essa soma explicitamente, e não em notação sigma. A soma de um quadrático em será cúbica em , fato que os estudantes familiarizados com o método das diferenças finitas podem compreender intuitivamente: diferenciar um cúbico produz um quadrático, portanto, somar um quadrático produz um cúbico. Determinar os coeficientes de cúbico é simples se os alunos estiverem confortáveis em manipular{1,2,…,n}x¯=n+12Sxx=∑ni=1(xi−x¯)2=∑nk=1(k−n+12)2knf(n)Σnotação e conheça (e lembre-se!) as fórmulas para e . Mas eles também podem ser deduzidos usando diferenças finitas, como segue.∑nk=1k∑nk=1k2
Quando , o conjunto de dados é apenas , , então .n=1{1}x¯=1f(1)=(1−1)2=0
Para , os dados são , , então .n=2{1,2}x¯=1.5f(2)=(1−1.5)2+(2−1.5)2=0.5
Para , os dados são , , então .n=3{1,2,3}x¯=2f(3)=(1−2)2+(2−2)2+(3−2)2=2
Esses cálculos são bastante breves e ajudam a reforçar o que a notação significa e, em pouco tempo, produzimos a tabela de diferenças finitas.∑ni=1(xi−x¯)2
Podemos obter os coeficientes de acionando o método das diferenças finitas, conforme descrito nos links acima. Por exemplo, as constantes terceiras diferenças indicam que nosso polinômio é realmente cúbico, com o coeficiente à esquerda . Existem alguns truques para minimizar o trabalho árduo: um bem conhecido é usar as diferenças comuns para estender a sequência de volta para , pois saber que imediatamente liberta o coeficiente constante. Outra é tentar estender a sequência para ver se é zero para um número inteirof(n)0.53!=112n=0f(0)f(n)n- por exemplo, se a sequência tivesse sido positiva, mas decrescente, valeria a pena estender-se para a direita para ver se poderíamos "pegar uma raiz", pois isso facilita a fatoração mais tarde. No nosso caso, a função parece pairar em torno de valores baixos quando é pequeno, então vamos estender ainda mais para a esquerda.n
Aha! Acontece que pegamos as três raízes: . Portanto, o polinômio possui fatores de , e . Por ser cúbico, deve ter a forma:f(−1)=f(0)=f(1)=0(n+1)n(n−1)
f(n)=an(n+1)(n−1)
Podemos ver que deve ser o coeficiente de que já determinamos ser . Alternativamente, uma vez que , temos que leva à mesma conclusão. Expandir a diferença de dois quadrados dá:an3112f(2)=0.5a(2)(3)(1)=0.5
Sxx=n(n2−1)12
Como o mesmo argumento se aplica a , o denominador é e nós terminamos. Ignorando minha exposição, esse método é surpreendentemente curto. Se for possível notar que o polinômio é cúbico, é necessário apenas calcular para os casos para estabelecer a terceira diferença é 0,5. Raiz caçadores só precisa de estender o para a esquerda da sequência de e , por, quando todos os três raízes são encontradas. Levei alguns minutos para encontrar dessa maneira.SyySxxSyy−−−−−−√=S2xx−−−√=SxxSxxn∈{1,2,3,4}n=0n=−1Sxx
Numerador, ∑i(xi−x¯)(yi−y¯)
Observo a identidade que pode ser reorganizada em:(b−a)2≡b2−2ab+a2
ab≡12(a2+b2−(b−a)2)
Se deixarmos que e temos o resultado útil que porque os meios, sendo idênticos, se cancelam. Essa foi a minha intuição para escrever a identidade em primeiro lugar; Eu queria mudar de trabalhar com o produto dos momentos para o quadrado de suas diferenças. Agora temos:a=xi−x¯=xi−n+12b=yi−y¯=yi−n+12b−a=yi−xi=di
(xi−x¯)(yi−y¯)=12((xi−x¯)2+(yi−y¯)2−d2i)
Esperamos que mesmo os alunos que não sabem como manipular a notação possam ver como a soma do conjunto de dados gera:Σ
Sxy=12(Sxx+Syy−∑i=1nd2i)
Já estabelecemos, reordenando as somas, que , deixando-nos com:Syy=Sxx
Sxy=Sxx−12∑i=1nd2i
A fórmula para o coeficiente de correlação de Spearman está ao nosso alcance!
rS=SxySxxSyy−−−−−−√=Sxx−12∑id2iSxx=1−∑id2i2Sxx
Substituindo o resultado anterior, concluirá o trabalho.Sxx=112n(n2−1)
rS=1−∑id2i212n(n2−1)=1−6∑id2in(n2−1)