Fiz um experimento em que coletei medições de vários participantes. Cada ponto de dados relevante possui duas variáveis, ambas categóricas: de fato, cada variável possui dois valores possíveis (respostas a duas perguntas sim / não). Eu gostaria de um teste de hipótese estatística para verificar se parece haver uma correlação entre essas duas variáveis.
Se eu tivesse um ponto de dados por participante, poderia usar o teste exato de Fisher na tabela de contingência resultante . No entanto, tenho vários pontos de dados por participante. Consequentemente, o teste exato de Fisher não parece aplicável, porque os pontos de dados de um único participante não são independentes. Por exemplo, se eu tenho 10 pontos de dados de Alice, esses provavelmente não são independentes, porque todos vieram da mesma pessoa. O teste exato de Fisher supõe que todos os pontos de dados foram amostrados independentemente, portanto, as suposições do teste exato de Fisher não são satisfeitas e seria inapropriado usar nessa configuração (pode fornecer relatórios injustificados de significância estatística).
Existem técnicas para lidar com essa situação?
Abordagens que considerei:
Uma alternativa plausível é agregar todos os dados de cada participante em um único número e, em seguida, usar outro teste de independência. Por exemplo, para cada participante, eu poderia contar a fração de respostas Yes para a primeira pergunta e a fração de respostas Yes para a segunda pergunta, fornecendo dois números reais por participante e, em seguida, usar o teste de momento do produto de Pearson para testar a correlação entre esses dois números. No entanto, não tenho certeza se essa é uma boa abordagem. (Por exemplo, eu me preocupo que a média / contagem esteja lançando dados e isso possa estar perdendo energia, devido à agregação; ou que os sinais de dependência possam desaparecer após a agregação.)
Eu li sobre modelos de vários níveis, que parecem ter a intenção de lidar com essa situação quando as variáveis subjacentes são contínuas (por exemplo, números reais) e quando um modelo linear é apropriado. No entanto, aqui tenho duas variáveis categóricas (respostas às perguntas Sim / Não), para que elas não se apliquem aqui. Existe alguma técnica equivalente aplicável aos dados categóricos?
Também li um pouco sobre o design de medidas repetidas na Wikipedia, mas o artigo da Wikipedia se concentra em estudos longitudinais. Isso não parece aplicável aqui: se eu entendi direito, medidas repetidas parecem focar nos efeitos devido à passagem do tempo (onde a progressão do tempo influencia as variáveis). No entanto, no meu caso, a passagem do tempo não deve ter nenhum efeito relevante. Diga-me se eu entendi errado.
Em uma reflexão mais aprofundada, outra abordagem que me ocorre é usar um teste de permutação. Para cada participante, poderíamos permutar aleatoriamente suas respostas para a pergunta 1 e (independentemente) permutar aleatoriamente suas respostas para a pergunta 2, usando uma permutação diferente para cada participante. No entanto, não está claro para mim qual estatística de teste seria apropriada aqui, para medir quais resultados são "pelo menos tão extremos" quanto o resultado observado.
Relacionado: Como tratar corretamente vários pontos de dados para cada sujeito (mas que também se concentra em modelos lineares para variáveis contínuas, não em dados categóricos), as medições são feitas no mesmo paciente independente? (mesmo)