Estou procurando várias maneiras de explicar aos meus alunos (em um curso básico de estatística) o que é um teste bicaudal e como o valor P é calculado.
Como você explica a seus alunos o teste bicaudal ou bicaudal?
Estou procurando várias maneiras de explicar aos meus alunos (em um curso básico de estatística) o que é um teste bicaudal e como o valor P é calculado.
Como você explica a seus alunos o teste bicaudal ou bicaudal?
Respostas:
Esta é uma ótima pergunta e estou ansioso pela versão de todos para explicar o valor-p e o teste bicaudal vs bicaudal. Eu tenho ensinado estatísticas a colegas cirurgiões ortopédicos e, portanto, tentei mantê-lo o mais básico possível, pois a maioria deles não faz matemática avançada há 10 a 30 anos.
Começo com uma explicação de que, se acreditarmos que temos uma moeda justa, sabemos que ela deve terminar em 50% dos flips em média ( ). Agora, se você se pergunta qual é a probabilidade de obter apenas 2 caudas de 10 lançamentos com esta moeda justa, pode calcular essa probabilidade como eu fiz no gráfico de barras. No gráfico, você pode ver que a probabilidade de obter 8 de 10 lançamentos com uma moeda justa é de cerca de .
Como questionaríamos a justiça da moeda se obtivéssemos 9 ou 10 caudas, temos que incluir essas possibilidades, a cauda do teste. Ao adicionar os valores, obtemos que a probabilidade agora é um pouco mais de de obter 2 caudas ou menos.
Como nós, em medicina, geralmente estamos interessados em estudar falhas, precisamos incluir o lado oposto da probabilidade, mesmo que nossa intenção seja fazer o bem e introduzir um tratamento benéfico.
Este exemplo simples também mostra quão dependentes somos da hipótese nula para calcular o valor-p. Também gosto de destacar a semelhança entre a curva binomial e a curva de sino. Ao mudar para 200 movimentos, você obtém uma maneira natural de explicar por que a probabilidade de obter exatamente 100 movimentos começa a não ter relevância. Os intervalos de definição de interesse são uma transição natural para as funções de densidade de probabilidade / função de massa e suas contrapartes acumuladas.
Na minha turma, recomendo a eles os vídeos estatísticos da academia Khan e também uso algumas de suas explicações para certos conceitos. Eles também jogam moedas onde analisamos a aleatoriedade da moeda lançada - o que eu tento mostrar é que a aleatoriedade é mais aleatória do que aquilo que geralmente acreditamos inspirado neste episódio do Radiolab .
Normalmente, tenho um gráfico / slide, o código R que usei para criar o gráfico:
library(graphics)
binom_plot_function <- function(x_max, my_title = FALSE, my_prob = .5, edges = 0,
col=c("green", "gold", "red")){
barplot(
dbinom(0:x_max, x_max, my_prob)*100,
col=c(rep(col[1], edges), rep(col[2], x_max-2*edges+1), rep(col[3], edges)),
#names=0:x_max,
ylab="Probability %",
xlab="Number of tails", names.arg=0:x_max)
if (my_title != FALSE ){
title(main=my_title)
}
}
binom_plot_function(10, paste("Flipping coins", 10, "times"), edges=0, col=c("#449944", "gold", "#994444"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", "gold"))
binom_plot_function(10, edges=3, col=c(rgb(200/255, 0, 0), "gold", rgb(200/255, 100/255, 100/255)))
Suponha que você queira testar a hipótese de que a altura média dos homens é de 5 pés e 7 polegadas. Você seleciona uma amostra aleatória de homens, mede suas alturas e calcula a média da amostra. Sua hipótese então é:
Na situação acima, você faz um teste bicaudal, pois rejeitaria seu nulo se a média da amostra for muito baixa ou muito alta.
Nesse caso, o valor p representa a probabilidade de realizar uma média amostral que seja pelo menos tão extrema quanto a que realmente obtivemos assumindo que o nulo é de fato verdadeiro. Portanto, se a média da amostra for "5 pés 8 polegadas", o valor-p representará a probabilidade de observar alturas maiores que "5 pés 8 polegadas" ou alturas menores que "5 pés 6 polegadas", desde que nulo é verdade.
Se, por outro lado, sua alternativa foi enquadrada da seguinte forma:
Na situação acima, você faria um teste unilateral no lado direito. O motivo é que você preferiria rejeitar o nulo em favor da alternativa apenas se a média da amostra for extremamente alta.
A interpretação do valor-p permanece a mesma com a leve nuance de que agora estamos falando sobre a probabilidade de realizar uma média amostral maior que a que realmente obtivemos. Portanto, se a média da amostra for "5 pés 8 polegadas", o valor-p representará a probabilidade de observar alturas maiores que "5 pés 8 polegadas", desde que o valor nulo seja verdadeiro.