Como lidar com várias medidas por participante, com dados categóricos?

Fiz um experimento em que coletei medições de vários participantes. Cada ponto de dados relevante possui duas variáveis, ambas categóricas: de fato, cada variável possui dois valores possíveis (respostas a duas perguntas sim / não). Eu gostaria de um teste de hipótese estatística para verificar se parece haver uma correlação entre essas duas variáveis.

Se eu tivesse um ponto de dados por participante, poderia usar o teste exato de Fisher na tabela de contingência resultante . No entanto, tenho vários pontos de dados por participante. Consequentemente, o teste exato de Fisher não parece aplicável, porque os pontos de dados de um único participante não são independentes. Por exemplo, se eu tenho 10 pontos de dados de Alice, esses provavelmente não são independentes, porque todos vieram da mesma pessoa. O teste exato de Fisher supõe que todos os pontos de dados foram amostrados independentemente, portanto, as suposições do teste exato de Fisher não são satisfeitas e seria inapropriado usar nessa configuração (pode fornecer relatórios injustificados de significância estatística). $2 \times 2$

Existem técnicas para lidar com essa situação?

Abordagens que considerei:

Uma alternativa plausível é agregar todos os dados de cada participante em um único número e, em seguida, usar outro teste de independência. Por exemplo, para cada participante, eu poderia contar a fração de respostas Yes para a primeira pergunta e a fração de respostas Yes para a segunda pergunta, fornecendo dois números reais por participante e, em seguida, usar o teste de momento do produto de Pearson para testar a correlação entre esses dois números. No entanto, não tenho certeza se essa é uma boa abordagem. (Por exemplo, eu me preocupo que a média / contagem esteja lançando dados e isso possa estar perdendo energia, devido à agregação; ou que os sinais de dependência possam desaparecer após a agregação.)

Eu li sobre modelos de vários níveis, que parecem ter a intenção de lidar com essa situação quando as variáveis subjacentes são contínuas (por exemplo, números reais) e quando um modelo linear é apropriado. No entanto, aqui tenho duas variáveis categóricas (respostas às perguntas Sim / Não), para que elas não se apliquem aqui. Existe alguma técnica equivalente aplicável aos dados categóricos?

Também li um pouco sobre o design de medidas repetidas na Wikipedia, mas o artigo da Wikipedia se concentra em estudos longitudinais. Isso não parece aplicável aqui: se eu entendi direito, medidas repetidas parecem focar nos efeitos devido à passagem do tempo (onde a progressão do tempo influencia as variáveis). No entanto, no meu caso, a passagem do tempo não deve ter nenhum efeito relevante. Diga-me se eu entendi errado.

Em uma reflexão mais aprofundada, outra abordagem que me ocorre é usar um teste de permutação. Para cada participante, poderíamos permutar aleatoriamente suas respostas para a pergunta 1 e (independentemente) permutar aleatoriamente suas respostas para a pergunta 2, usando uma permutação diferente para cada participante. No entanto, não está claro para mim qual estatística de teste seria apropriada aqui, para medir quais resultados são "pelo menos tão extremos" quanto o resultado observado.

Relacionado: Como tratar corretamente vários pontos de dados para cada sujeito (mas que também se concentra em modelos lineares para variáveis contínuas, não em dados categóricos), as medições são feitas no mesmo paciente independente? (mesmo)

— DW
fonte

E o teste de McNemar? É exatamente para isso que serve.

— StatsStudent

@StatsStudent, você pode elaborar? Não vejo como isso se aplica a essa situação. Por "ponto de dados", quero dizer uma tupla contendo a resposta para as perguntas sim / não (por exemplo, sim, sim). Quando leio sobre o teste de McNemar, trata-se de um único ponto de dados por participante; não é o caso de vários pontos de dados por participante (por exemplo, cada participante é exposto várias vezes e após cada exposição, obtemos a resposta para as perguntas sim / não).

— DW

O teste de McNemar ainda se aplica, se eu entender seu cenário corretamente. Você configura sua tabela 2x2, apenas, em vez de contagens de assuntos em cada célula da tabela, você tem pares. Por exemplo, em vez de classificar indivíduos em cada célula, você determinaria quantos pares de indivíduos responderiam "Sim" à primeira pergunta e "Sim" à segunda pergunta e colocariam o resultado na Célula . O número de pares que responderam "sim" à primeira pergunta e "Não" para a segunda seria inserido na célula , etc.

a

$a$

b

$b$

— StatsStudent

@StatsStudent, pares de indivíduos? Suspeito que devo ter me comunicado mal. Faço duas perguntas a um único indivíduo e recebo um par de respostas (diga Sim, Sim). Se isso fosse tudo, eu poderia usar o teste de McNemar. Mas a reviravolta aqui é que, para algumas pessoas, eu fiz isso várias vezes: por exemplo, para Alice, eu fiz a ela o par de perguntas em vários momentos diferentes e obtive duas respostas a cada momento. Você poderia dizer que alguns participantes receberam "exposições múltiplas" (onde cada exposição é o caso de eu fazer as duas perguntas e receber de volta as duas respostas).

— DW

Entendo! Era isso que eu estava entendendo errado - desculpe, eu não entendi isso antes: você tem uma terceira dimensão na qual está coletando dados (por exemplo, ao longo do tempo). Nesse caso, eu recomendaria o uso de regressão logística com equações de estimativa generalizadas ou modelos mistos. Os modelos longitudinais são válidos aqui, mesmo que sua terceira dimensão não seja exatamente a hora. Você também pode estratificar suas tabelas na terceira dimensão e executar as de McNemar em cada dimensão.

— StatsStudent

Contexto da minha resposta

Estudei esta questão ontem (a parte relativa à possibilidade de usar modelos mistos aqui). Eu descaradamente descarto meu novo entendimento sobre essa abordagem para tabelas 2x2 e espero que colegas mais avançados corrijam minhas imprecisões ou mal-entendidos. Minha resposta será longa e excessivamente didática (pelo menos tentando ser didática) para ajudar, mas também expor minhas próprias falhas. Antes de tudo, devo dizer que compartilhei sua confusão que você declarou aqui.

Eu li sobre modelos de vários níveis, que parecem ter a intenção de lidar com essa situação quando as variáveis subjacentes são contínuas (por exemplo, números reais) e quando um modelo linear é apropriado

Estudei todos os exemplos deste artigo , modelando efeitos aleatórios de dados de resposta categórica . O próprio título contradiz esse pensamento. Para o nosso problema com tabelas 2x2 com medição repetida, o exemplo na seção 3.6 é pertinente à nossa discussão. Isso é apenas para referência, pois meu objetivo é explicá-lo. Eu posso editar esta seção no futuro se esse contexto não for mais necessário.

O modelo

$\pi_i$ $i$ $logit(\pi_{i})= FixedEffects_i + RandomEffect_i$

R a n d o m E f f e c t_{i} \sim N (0, σ)

$RandomEffect_i\sim N(0,\sigma)$

$\pi_{ijv}$

eu o g Eu t (π_{Eu j v}) = β_{j v} + {você}_{Eu v}

$logit(\pi_{ijv})=\beta_{jv}+u_{iv}$

Sobre os efeitos fixos

$\beta_{1v}=\beta_{2v}=\beta_{3v}...$ $i$ $\beta_{jv}$ $\beta_{v}$ $\beta_{1}=\beta_{2}$

Sobre efeitos aleatórios

$u_{ij}$ $u_{i}$ $i$ $v$ $u_{i}\sim N(0,\sigma_1)$ $u_{ij}\sim N(0,\sigma_2)$

Uma proposição

$u_{i}+u_{iv}$ $u_{iv}$ $u_i$ $u_{i}$

model1<-glmer(yes ~ Question + (1 | Subject/Question ), data = df, family = binomial)
model2<-glmer(yes ~ Question + (1 | Subject:Question ), data = df, family = binomial)
anova(model1,model2)

(1 | Subject/Question ) $u_{i}+u_{iv}$ (1 |Subject:Question) $u_{iv}$ anova

— brumar
fonte

Uau! Obrigado por esta resposta detalhada! Isso me dá um excelente histórico. No entanto, ainda não estou vendo como usar isso para testar se as respostas da pergunta nº 1 estão correlacionadas às respostas da pergunta nº 2. Você pode elaborar como fazer isso? Vejo como obter um modelo para a resposta da pergunta nº 1; e um modelo para a resposta à pergunta 2; mas esses modelos assumem essencialmente que as duas respostas são independentes, enquanto no meu caso é exatamente isso que quero testar.

— DW

β_{1}

$\beta_1$

β_{2}

$\beta_2$