Vários testes qui-quadrado


11

Eu tenho dados classificados cruzados em uma tabela 2 x 2 x 6. Vamos chamar as dimensões response, Ae B. Ajustei uma regressão logística aos dados com o modelo response ~ A * B. Uma análise de desvio desse modelo diz que os termos e sua interação são significativos.

No entanto, olhando para as proporções dos dados, parece que apenas 2 níveis Bsão responsáveis ​​por esses efeitos significativos. Eu gostaria de testar para ver quais níveis são os culpados. No momento, minha abordagem é realizar 6 testes qui-quadrado em 2 x 2 tabelas de response ~ Ae, em seguida, ajustar os valores de p desses testes para múltiplas comparações (usando o ajuste de Holm).

Minha pergunta é se existe uma abordagem melhor para esse problema. Existe uma abordagem de modelagem mais baseada em princípios ou uma abordagem de comparação de testes com qui-quadrado?


Certa vez, fiz a mesma pergunta na lista de discussão R e não obtive resposta. Eu sugiro que você altere seu título, pois sua pergunta é sobre "análise post hoc do quadrado do chi - para detectar a causa do significado" (títulos mais curtos que o que propus seriam melhores :))
Tal Galili

Basta olhar os betas para seus culpados ... E usar um modelo log-linear de poisson. Você obtém a mesma coisa que o teste do qui-quadrado, mas obtém todos os testes diferentes de uma só vez.
probabilityislogic

Respostas:


11

Você deve procurar "particionar o qui-quadrado". Isso é semelhante em lógica à execução de testes post-hoc na ANOVA. Isso permitirá que você determine se seu teste geral significativo é atribuído principalmente a diferenças em categorias ou grupos de categorias específicos.

Um rápido google apareceu esta apresentação, que no final discute métodos para particionar o qui-quadrado.

http://www.ed.uiuc.edu/courses/EdPsy490AT/lectures/2way_chi-ha-online.pdf


Interessante. Você já se deparou com uma implementação R disso?
Tal Galili

Não, não diretamente. No entanto, R fornecerá tudo o que você precisa para fazer isso - como: as contagens observadas, os valores esperados e os resíduos para cada célula. x <- matriz (c (12, 5, 7, 7), ncol = 2) chisq.test (x) chisq.test observado (x) $ residuaisexpectedchisq.test(x)
Brett

Vou te dar uma nota, pois isso deve ser útil para a minha vida de pesquisa. No entanto, essa abordagem é aplicável a uma matriz ixj. No entanto, a minha pergunta envolve uma matriz ixjxk,
JoFrhwld

2
O particionamento de qui-quadrado é extensível a tabelas de contingência de várias vias. Aqui está o artigo que Agresti cita em seu livro, de fato ... HO Lancaster (1951) "Tabelas complexas de contingência tratadas pela partição do χ2" Jornal da Royal Statistical Society. Série B (Metodológica), vol. 13, No. 2
Brett

1

A abordagem sem princípios é descartar os dados desproporcionais, reequipar o modelo e ver se as razões de chances logit / condicionais para resposta e A são muito diferentes (controlando B). Isso pode lhe dizer se há motivo para preocupação. Reunir os níveis de B é outra abordagem. Em linhas mais baseadas em princípios, se você está preocupado com proporções relativas que induzem o paradoxo de Simpson, pode analisar os índices de chances condicionais e marginais da resposta / A e ver se eles revertem.

Para evitar múltiplas comparações em particular, a única coisa que me ocorre é usar um modelo hierárquico que explique efeitos aleatórios entre os níveis.


0

Não sei exatamente quais são seus objetivos ou por que eles são o que são. Mas, em vez de testar hipóteses, geralmente recomendo focar a atenção em previsões e intervalos de confiança.


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.