Suponha que eu tenha três populações com quatro características mutuamente exclusivas. Coleto amostras aleatórias de cada população e construo uma tabela de referência cruzada ou de frequência para as características que estou medindo. Estou correto ao dizer que:
Se eu quisesse testar se existe alguma relação entre as populações e as características (por exemplo, se uma população tem uma frequência mais alta de uma das características), eu deveria executar um teste qui-quadrado e ver se o resultado é significativo.
Se o teste do qui-quadrado é significativo, isso apenas me mostra que há alguma relação entre as populações e as características, mas não como elas estão relacionadas.
Além disso, nem todas as características precisam estar relacionadas à população. Por exemplo, se as diferentes populações têm distribuições significativamente diferentes das características A e B, mas não de C e D, o teste do qui-quadrado ainda pode voltar como significativo.
Se eu quisesse medir se ou não uma característica específica é afetada pela população, então eu posso executar um teste de proporções iguais (Eu já vi esse chamado de Z-teste, ou como
prop.test()
emR
) em apenas essa característica.
Em outras palavras, é apropriado usar o prop.test()
para determinar com mais precisão a natureza de um relacionamento entre dois conjuntos de categorias quando o teste do qui-quadrado indica que existe um relacionamento significativo?