Compreendendo o teste do qui-quadrado e a distribuição do qui-quadrado

Estou tentando entender a lógica por trás do teste do qui-quadrado.

O teste do qui-quadrado é . é então comparado a uma distribuição qui-quadrado para descobrir um valor p.a fim de rejeitar ou não a hipótese nula. : as observações vêm da distribuição que usamos para criar nossos valores esperados. Por exemplo, poderíamos testar se a probabilidade de obteré dada porcomo esperamos. Então jogarmos 100 vezes e encontrare. Queremos comparar nossa descoberta com o que é esperado (). Poderíamos também usar uma distribuição binomial, mas esse não é o objetivo da pergunta ... A questão é: $\chi ^2 = \sum \frac{(obs-exp)^2}{exp}$ $\chi ^2$ $H_0$ head $p$ $n_H$ Heads $1-n_H$ tails $100 \cdot p$

Você pode explicar por que, sob a hipótese nula, segue uma distribuição qui-quadrado? $\sum \frac{(obs-exp)^2}{exp}$

Tudo o que sei sobre a distribuição qui-quadrado é que a distribuição qui-quadrado do grau é a soma da distribuição normal padrão de ao quadrado. $k$ $k$

— Remi.b
fonte

Não faz: é uma aproximação. Muito mais sobre isso aparece no tópico stats.stackexchange.com/questions/16921/… .

— whuber

Isso pode ser de interesse Karl Pearson e o teste do qui-quadrado (Placket, 1983) {pdf}

— Avraham

Uma pergunta relacionada sobre por que a distribuição qui-quadrado é usada para testes de qualidade de ajuste, embora não seja uma duplicata: stats.stackexchange.com/questions/125312/…

— Silverfish

Poderíamos também usar uma distribuição binomial, mas esse não é o ponto da questão…

No entanto, é o nosso ponto de partida, mesmo para a sua pergunta real. Vou abordar isso de maneira informal.

Vamos considerar com o caso binomial de maneira mais geral:

$Y\sim \text{Bin}(n,p)$

Suponha que e sejam tais que seja bem aproximado por um normal com a mesma média e variância (alguns requisitos típicos são menores que não são pequenos ou que não é pequeno). $n$ $p$ $Y$ $\min(np,n(1-p))$ $np(1-p)$

Então será aproximadamente . Aqui $(Y-E(Y))^2/\text{Var}(Y)$ $\sim\chi^2_1$ $Y$ é o número de sucessos.

$E(Y) = np$ $\text{Var}(Y)=np(1-p)$

$n$ $p$ $H_0$

$(Y-np)^2/np(1-p)$ $\sim\chi^2_1$ .

Note that $(Y-np)^2 = [(n-Y)-n(1-p)]^2$ . Also note that $\frac{1}{p} + \frac{1}{1-p} = \frac{1}{p(1-p)}$ .

Hence $\frac{(Y-np)^2}{np(1-p)} = \frac{(Y-np)^2}{np}+\frac{(Y-np)^2}{n(1-p)}\\ \quad= \frac{(Y-np)^2}{np}+\frac{[(n-Y)-n(1-p)]^2}{n(1-p)} \\ \quad= \frac{(O_S-E_S)^2}{E_S}+\frac{(O_F-E_F)^2}{E_F}$

Which is just the chi-square statistic for the binomial case.

So in that case the chi-square statistic should have the distribution of the square of an (approximately) standard-normal random variable.

— Glen_b -Reinstate Monica
fonte