Estou olhando para uma planilha do Excel que afirma estar calculando o , mas não reconheço essa maneira de fazê-lo, e fiquei pensando se estou perdendo alguma coisa.
Aqui estão os dados que está analisando:
+------------------+----------+----------+
| Total Population | Observed | Expected |
+------------------+----------+----------+
| 2000 | 42 | 32.5 |
| 2000 | 42 | 32.5 |
| 2000 | 25 | 32.5 |
| 2000 | 21 | 32.5 |
+------------------+----------+----------+
E aqui estão as somas que ele faz para cada grupo para calcular o quadrado do qui:
P = (sum of all observed)/(sum of total population) = 0.01625
A = (Observed - (Population * P)) ^2
B = Total Population * P * (1-P)
ChiSq = A/B
Portanto, para cada grupo, o é:
2.822793
2.822793
1.759359
4.136448
Eo total Praça Chi é: 11.54139
.
No entanto, todos os exemplos que tenho visto de calcular o são completamente diferentes disso. Eu faria para cada grupo:
chiSq = (Observed-Expected)^2 / Expected
E, portanto, para o exemplo acima, eu obteria um valor total de chi quadrado de 11.3538
.
ATUALIZAR
Minha razão para querer saber isso é que estou tentando replicar esses resultados na linguagem R. Estou usando a função chisq.test e ela não sai com o mesmo número que a planilha do Excel. Portanto, se alguém souber como fazer essa abordagem em R, seria muito útil!
ATUALIZAÇÃO 2
Se alguém estiver interessado, veja como eu o calculei em R:
res <- matrix(c((2000-42), 42, (2000-42), 42, (2000-25), 25, (2000-21), 21), 2, 4)
chisq.test(res)
x=c(42,42,25,21);chisq.test(cbind(x,2000-x))