A associação "focal" entre a categoria de uma variável nominal e a categoria da outra é expressa pela frequência residual na célula , como sabemos. Se o residual for 0, significa que a frequência é o que é esperado quando as duas variáveis nominais não estão associadas. Quanto maior o residual, maior a associação, devido à combinação super-representada na amostra. O grande resíduo negativo diz equivalentemente a combinação sub-representada. Então, a frequência residual é o que você deseja.j i j i jijijij
Porém, os resíduos brutos não são adequados, pois dependem dos totais marginais, do total geral e do tamanho da tabela: o valor não é padronizado de forma alguma. Mas o SPSS pode exibir resíduos padronizados, também chamados de resíduos de Pearson. St. residual é o residual dividido por uma estimativa do seu desvio padrão (igual à raiz quadrada do valor esperado). Os resíduos de St. de uma tabela têm média 0 e st. dev. 1; portanto, st. residual serve um valor z, como valor z na distribuição de uma variável quantitativa (na verdade, é z na distribuição de Poisson). Os resíduos de St. são comparáveis entre diferentes tabelas do mesmo tamanho e o mesmo total . A estatística qui-quadrado de uma tabela de contingência é a soma do st quadrado. resíduosNiniciar. Comparando st. os resíduos em uma tabela e em tabelas com o mesmo volume ajudam a identificar as células específicas que mais contribuem para a estatística do qui-quadrado.
O SPSS também exibe resíduos ajustados (= resíduos padronizados ajustados). Adj. residual é o residual dividido por uma estimativa do seu erro padrão. Interessante que adj. residual é apenas igual a , em que é o total e é o Pearson correlação (alias de correlação Phi) entre manequim variáveis correspondentes às categorias e das duas variáveis nominais . Este é exatamente o que você diz que deseja calcular. Adj. residual está diretamente relacionado a ele. Nr i j ijrN−−√rijNrijijr
Ao contrário de st. residual, adj. O resíduo também é padronizado em função da forma das distribuições marginais na tabela (leva em consideração a frequência esperada não apenas nessa célula, mas também nas células fora de sua linha e coluna), para que você possa ver diretamente a força da empate entre as categorias e - sem se preocupar com se seus totais marginais são grandes ou pequenas em relação às outras categorias. Adj. residual também é como um escore z, mas agora é como z da distribuição normal (não Poisson). Se adj. residual é acima de 2 ou abaixo de -2, você pode concluir que é significativo no nível . Adj. os resíduos ainda são efetuados por ; j 1 N r r 2ijp<0.05
1Nr's não são, mas você pode obter todos os s de adj. resíduos, seguindo a fórmula acima, sem gastar tempo para produzir variáveis fictícias. r2
Em relação à sua segunda pergunta, sobre vínculos de categoria de três vias - isso é possível como parte da análise loglinear geral, que também exibe resíduos. No entanto, o uso prático de resíduos celulares de três vias é modesto: medidas de associação de 3 (+) vias não são facilmente padronizadas e não são facilmente interpretáveis.
1,96 ≈ 21 Em st. a curva normal é o ponto de corte de 2,5% da cauda, portanto 5% se você considerar as duas caudas como na hipótese alternativa dos dois lados.1.96≈2
i j r i j Pr ( i , 1 ) Pr ( i , 2 ) i i2 Segue-se que a significância do resíduo ajustado na célula é igual à significância de . Além disso, se houver apenas 2 colunas na tabela e você estiver executando o teste z de proporções entre e , proporções de coluna para a linha , o O valor p desse teste é igual à significância de ambos (qualquer) adj. resíduos na linha da tabela de 2 colunas.ijrijPr(i,1)Pr(i,2)ii