O artigo de 1900 da Pearson está sem direitos autorais, para que possamos lê-lo on line .
Você deve começar observando que este artigo trata do teste de qualidade do ajuste, não do teste de independência ou homogeneidade.
Ele prossegue trabalhando com o normal multivariado, e o qui-quadrado surge como uma soma das variáveis normais padronizadas ao quadrado.
Você pode ver na discussão da p160-161 que ele está discutindo claramente a aplicação do teste a dados distribuídos multinomiais (acho que ele não usa esse termo em nenhum lugar). Aparentemente, ele entende a normalidade multivariada aproximada do multinomial (certamente ele sabe que as margens são aproximadamente normais - esse é um resultado muito antigo - e conhece os meios, variações e covariâncias, uma vez que são declarados no artigo); meu palpite é que a maioria dessas coisas já é antiga em 1900. (Observe que a própria distribuição do qui-quadrado remonta ao trabalho de Helmert em meados da década de 1870).
Então, no final da p163, ele deriva uma estatística do qui-quadrado como "uma medida da qualidade do ajuste" (a própria estatística aparece no expoente da aproximação normal multivariada).
Ele então discute como avaliar o valor de p * e, em seguida, fornece corretamente a área superior da cauda de um além de 43,87 como 0,000016. [Você deve ter em mente, no entanto, que ele não entendeu corretamente como ajustar os graus de liberdade para a estimativa de parâmetros nesse estágio; portanto, alguns dos exemplos em seus trabalhos usam um df muito alto]χ212
* (observe que não existem paradigmas de teste de Fisherian e Neyman-Pearson, no entanto, vemos claramente que ele já aplica o conceito de um valor-p.)
Você notará que ele não escreve explicitamente termos como . Em vez disso, ele escreve m 1 , m 2 etc para as contagens esperadas e para as quantidades observadas, ele usa m ′ 1 e assim por diante. Ele então define e = m - m ′ (metade inferior p160) e calcula e 2 / m( OEu- EEu)2/ EEum1m2m′1e = m - m′e2/ m para cada célula (veja a eq. (Xv) p163 e a última coluna da tabela na parte inferior da p167) ... quantidades equivalentes, mas em notação diferente.
Grande parte da maneira atual de entender o teste do qui-quadrado ainda não está em vigor, mas, por outro lado, já existe um pouco (pelo menos se você souber o que procurar). Muita coisa aconteceu nos anos 1920 (e em diante) que mudou a maneira como encaramos essas coisas.
Quanto ao motivo pelo qual dividimos por no caso multinomial, acontece que, embora a variação dos componentes individuais em um multinomial seja menor que E i , quando contabilizamos as covariâncias, é equivalente a apenas dividir por E i , tornando para uma boa simplificação.EEuEEuEEu
Adicionado na edição:
O artigo de 1983 de Plackett fornece uma grande quantidade de contexto histórico e um guia para o artigo. Eu recomendo dar uma olhada nisso. Parece que é gratuito on-line via JStor (se você fizer login), então você não precisa nem acessar uma instituição para lê-lo.
Plackett, RL (1983),
"Karl Pearson e o Teste Qui-Quadrado",
International Statistical Review ,
vol. 51, nº 1 (abr), pp. 59-72