O teste

Acabei de ler em uma revista científica (popular) bastante respeitada (o PM alemão, 02/2013, p.36) sobre um experimento interessante (sem fonte, infelizmente). Isso chamou minha atenção porque intuitivamente duvidei do significado do resultado, mas as informações fornecidas foram suficientes para reproduzir os testes estatísticos.

Os pesquisadores se perguntaram se ficar frio no frio aumenta as chances de pegar um resfriado. Então eles dividiram aleatoriamente um grupo de 180 alunos em dois grupos. Um grupo teve que manter os pés em água fria por 20 minutos. O outro manteve os sapatos. Tipo de manipulação engraçada, eu acho, mas por outro lado eu não sou médico e talvez os médicos pensem engraçado. Questões éticas de lado.

De qualquer forma, após 5 dias, 13 dos estudantes do grupo de tratamento estavam resfriados, mas apenas 5 do grupo que mantinham os sapatos. A razão de chances desse experimento é de 2,87.

Dado o tamanho da amostra bastante pequeno, comecei a me perguntar se essa diferença pode ser significativa. Então eu conduzi dois testes.

Primeiro, um teste simples de igualdade de proporções usando a aproximação normal. Este teste tem com . Meu palpite é que é isso que os pesquisadores testaram. Isso é realmente apenas significativo. No entanto, esse teste-z é válido apenas em amostras grandes, se não me engano, devido à aproximação normal. Além disso, as taxas de prevalência são bastante pequenas e me pergunto se isso pode não afetar a taxa de cobertura do intervalo de confiança do efeito. $z=1.988$ $p=0.0468$

Portanto, minha segunda tentativa foi um teste de independência do qui-quadrado, tanto na simulação de Monte-Carlo quanto no qui-quadrado de Pearson padrão. Aqui encontro valores-p ambos sobre . $p=.082$

Agora, isso não é tão tranquilizador sobre os resultados. Gostaria de saber se existem mais opções para testar esses dados e quais são seus pensamentos nos dois testes (em particular as suposições do primeiro teste significativo).

— tomka
fonte

Acredito que você tenha realizado uma correção de continuidade na estatística qui-quadrado de Pearson, que explica a discrepância nos valores de p.

— Scortchi - Restabelece Monica

Respostas:

Eu usaria um teste de permutação vez da aproximação Normal ou do qui-quadrado. O teste de permutação é exato e mais poderoso, dependendo dos dados.

Nesse caso, não podemos calcular todas as permutações dos grupos, mas podemos gerar muitas permutações aleatórias dos dados e obter um valor bastante preciso:

group <- c(rep("A",90),rep("B",90))
n_a <- rep(0,100000)
for (i in 1:length(n_a)) {
   temp <- sample(group, size=18)
   n_a[i] <- sum(temp == "A")
}
> mean(n_a >= 13)
[1] 0.03904

o que indicaria um valor p de 0,039.

No entanto, e isso é grande, no entanto, estou supondo que a suposição de que os sujeitos que estão resfriados sejam eventos independentes seja violada. Esses indivíduos são estudantes, presumivelmente na mesma escola. Imagine dois deles dividindo uma classe, um dormitório, alguma outra atividade ou uma lanchonete (em uma escola com várias lanchonetes); os eventos "# 1 resfriado" e "# 2 resfriado" não são independentes. Eu poderia imaginar que um aluno diria "vamos nos inscrever neste experimento!" para seu companheiro de quarto ou amigos; Eu podia imaginar que os alunos eram recrutados nas aulas que os professores davam; Eu poderia imaginar muitas maneiras pelas quais a suposição de independência é violada. Talvez o artigo, que eu não li, aborda alguns deles, mas é difícil ver como ele poderia abordar todos eles,

— jbowman
fonte

Obrigado @jbowman - além disso, você realizou um teste unilateral, pelo que entendi. Eu acho que isso faz mais sentido do que os testes de dois lados que eu usei. Se a aproximação normal for feita de um lado, os valores de p serão 0,023 acima. Gosto da poesia sobre independência. Provavelmente, os alunos também não estavam isolados quando mantinham os pés na água, então essa também é uma maneira de transmitir um resfriado.

— Tomka

(+1) Mas vale a pena notar que você não precisa simular: a distribuição da estatística do seu teste segue uma distribuição hipergeométrica sob a hipótese nula (e condicionamento nos totais marginais). Este é o teste exato de Fisher.

— Scortchi - Restabelece Monica

@jbowman lhe deu uma boa opção. Pensei em fornecer algumas informações sobre suas perguntas explícitas sobre a adequação do teste versus teste . $z$ $\chi^2$

-test: $\boldsymbol z$

$z$ $z$ $t$

$t$ $z$ $z$ -test ser usado no seu caso? O motivo é que seus dados são

$N$ $91\times 91 = 1,\!729$ $N = 180$ $z$

$\boldsymbol \chi^2$

$\chi^2$ $\chi^2$ $z$ $\chi^2$ $\chi^2$ $z$ $z$

$z$ $\chi^2$

— Repor a Monica
fonte

Obrigado @gung, eu realmente aprecio seus esforços. Isso torna as coisas mais claras.

— Tomka

@gung Estou confuso - o quadrado chi e z de proporção são iguais ou não? stats.stackexchange.com/questions/173415/…

— Xavier Bourret Sicotte

@XavierBourretSicotte, o teste z é frequentemente implementado sob o capô como um teste qui-quadrado, R faz isso por exemplo. Muitas vezes, ainda prefiro usar o teste z porque as informações são apresentadas de maneira consistente com o entendimento de que 1 variável é covariável e a outra é a resposta.

— gung - Restabelece Monica

(+1) @XavierBourretSicotte: Existem dois testes z comumente usados para a diferença entre duas proporções: um é um teste de pontuação, equivalente ao teste qui-quadrado de Pearson (no qual a variação no denominador é calculada sob o melhor ajuste nulo); o outro é um teste de Wald (no qual a variação no denominador é calculada na estimativa de probabilidade máxima da diferença nas duas proporções).

— Scortchi - Restabelece Monica

@ Scortchi obrigado por esclarecer isso! É a primeira vez que me deparei com uma explicação tão explícita da diferença - você seria capaz de criar um link para lugares onde as duas abordagens são explicadas? Com as fórmulas correspondentes para a variação?

— Xavier Bourret Sicotte