Um diálogo entre um professor e um aluno atencioso
Humildemente submetido na crença de que não foram usados lápis de cera suficientes até agora neste tópico. Uma breve sinopse ilustrada aparece no final.
Aluno : O que significa um valor-p? Muitas pessoas parecem concordar que é a chance de "vermos uma média da amostra maior ou igual a" uma estatística ou "a probabilidade de observar esse resultado ... dada a hipótese nula é verdadeira" ou onde "a estatística da minha amostra caiu sobre uma distribuição [simulada] " e até " a probabilidade de observar uma estatística de teste pelo menos tão grande quanto a calculada assumindo que a hipótese nula é verdadeira " .
Mestre : Entendidas corretamente, todas essas afirmações estão corretas em muitas circunstâncias.
Aluno : Não vejo como a maioria deles é relevante. Você não nos ensinou que precisamos declarar uma hipótese nula e uma hipótese alternativa H A ? Como eles estão envolvidos nessas idéias de "maior que ou igual a" ou "pelo menos tão grande" ou o muito popular "mais extremo"?H0 0HUMA
Professor : Como pode parecer complicado em geral, ajudaria a explorar um exemplo concreto?
Aluno : Claro. Mas faça com que seja realista, mas simples, se puder.
Professor : Essa teoria do teste de hipóteses começou historicamente com a necessidade dos astrônomos de analisar erros observacionais, então que tal começar por aí. Eu estava examinando alguns documentos antigos um dia em que um cientista descreveu seus esforços para reduzir o erro de medição em seu aparelho. Ele havia feito muitas medições de uma estrela em uma posição conhecida e registrado seus deslocamentos à frente ou atrás dessa posição. Para visualizar esses deslocamentos, ele desenhou um histograma que - quando suavizado um pouco - se parecia com este.
Aluno : Lembro como os histogramas funcionam: o eixo vertical é rotulado como "Densidade" para me lembrar que as frequências relativas das medidas são representadas por área e não por altura.
Professor : Isso mesmo. Um valor "incomum" ou "extremo" seria localizado em uma região com uma área muito pequena. Aqui está um giz de cera. Você acha que poderia colorir em uma região cuja área é apenas um décimo do total?
Aluno : Claro; isso é fácil. [Cores na figura.]
Professor : Muito bom! Isso parece cerca de 10% da área para mim. Lembre-se, porém, que as únicas áreas no histograma que importam são aquelas entre linhas verticais: elas representam a chance ou probabilidade de que o deslocamento esteja localizado entre essas linhas no eixo horizontal. Isso significa que você precisava colorir todo o caminho até o fundo e isso seria mais da metade da área, não é?
Aluno : Entendo. Deixe-me tentar de novo. Vou querer colorir onde a curva é realmente baixa, não é? É mais baixo nas duas extremidades. Preciso colorir em apenas uma área ou seria bom dividi-lo em várias partes?
Professor : Usar várias partes é uma ideia inteligente. Onde eles estariam?
Aluno (apontando): Aqui e aqui. Como esse lápis não é muito afiado, usei uma caneta para mostrar as linhas que estou usando.
Professor : Muito bom! Deixe-me contar o resto da história. O cientista fez algumas melhorias em seu dispositivo e, em seguida, ele tomou medidas adicionais. Ele escreveu que o deslocamento do primeiro era de apenas , o que ele considerava um bom sinal, mas, sendo um cientista cuidadoso, passou a fazer mais medições como verificação. Infelizmente, essas outras medidas são perdidas - o manuscrito é interrompido neste momento - e tudo o que temos é esse número único, 0,1 .0,10,1
Aluno : Isso é muito ruim. Mas isso não é muito melhor do que a grande variedade de deslocamentos em sua figura?
Professor : Essa é a pergunta que eu gostaria que você respondesse. Para começar, o que devemos colocar como ?H0 0
Aluno : Bem, um cético se pergunta se as melhorias feitas no dispositivo têm algum efeito. O ônus da prova está no cientista: ele gostaria de mostrar que o cético está errado. Isso me faz pensar que a hipótese nula é meio ruim para o cientista: diz que todas as novas medidas - incluindo o valor de que conhecemos - devem se comportar conforme descrito no primeiro histograma. Ou talvez ainda pior do que isso: eles podem estar ainda mais espalhados.0,1
Professor : Continue, você está indo bem.
Aluno : E então a alternativa é que as novas medidas sejam menos difundidas, certo?
Professor : Muito bom! Você poderia me desenhar uma imagem de como seria um histograma com menos propagação? Aqui está outra cópia do primeiro histograma; você pode desenhar sobre ela como uma referência.
Aluno (desenho): estou usando uma caneta para delinear o novo histograma e estou colorindo a área abaixo dele. Eu fiz isso para que a maior parte da curva esteja próxima de zero no eixo horizontal e a maior parte de sua área esteja próxima de um valor (horizontal) de zero: é isso que significa ser menos disperso ou mais preciso.
Professor : Esse é um bom começo. Mas lembre-se de que um histograma mostrando chances deve ter uma área total de . A área total do primeiro histograma é, portanto, 1 . Quanta área está dentro do seu novo histograma?11
Aluno : Acho que menos da metade. Vejo que é um problema, mas não sei como corrigi-lo. O que devo fazer?
Professor : O truque é tornar o novo histograma mais alto que o antigo para que sua área total seja . Aqui, mostrarei uma versão gerada por computador para ilustrar.1
Aluno : Entendi: você esticou verticalmente para que seu formato não mudasse realmente, mas agora a área vermelha e a área cinza (incluindo a parte sob o vermelho) são as mesmas quantidades.
Professor : Certo. Você está vendo uma imagem da hipótese nula (em azul, espalhada) e parte da hipótese alternativa (em vermelho, com menos propagação).
Aluno : O que você quer dizer com "parte" da alternativa? Não é apenas a hipótese alternativa?
Professor : Estatísticos e gramática parecem não se misturar. :-) Sério, o que eles querem dizer com "hipótese" geralmente é um grande conjunto de possibilidades. Aqui, a alternativa (como você disse antes) é que as medidas são "menos difundidas" do que antes. Mas quanto menos ? Existem muitas possibilidades. Aqui, deixe-me mostrar outra. Eu desenhei com traços amarelos. Está entre os dois anteriores.
Aluno : Entendo: você pode ter quantidades diferentes de spread, mas não sabe de antemão quanto será realmente o spread. Mas por que você fez o sombreamento engraçado nessa foto?
Professor : Eu queria destacar onde e como os histogramas diferem. Eu os sombrei em cinza, onde os histogramas alternativos são menores que o nulo e em vermelho, onde as alternativas são maiores .
Aluno : Por que isso importa?
Professor : Você se lembra de como pintou o primeiro histograma nas duas caudas? [Examinando os papéis.] Ah, aqui está. Vamos colorir esta imagem da mesma maneira.
Aluno : Lembro-me: esses são os valores extremos. Encontrei os locais onde a densidade nula era a menor possível e colori 10% da área.
Professor : Conte-me sobre as alternativas nessas áreas extremas.
Aluno : É difícil ver, porque o giz de cera o encobriu, mas parece que quase não há chance de haver alternativa nas áreas que eu pintei. Seus histogramas estão diretamente no eixo do valor e não há espaço para nenhuma área abaixo deles.
Professor : Vamos continuar com esse pensamento. Se eu lhe dissesse, hipoteticamente, que uma medida teve um deslocamento de , e lhe pedisse para escolher qual desses três histogramas era o mais provável, de qual seria?- 2
Aluno : O primeiro - o azul. É o mais difundido e é o único onde parece ter alguma chance de ocorrer.- 2
Professor : E o valor de no manuscrito?0,1
Aluno : Hmmm ... essa é uma história diferente. Todos os três histogramas estão bem acima do solo em .0,1
Professor : OK, é justo. Mas suponha que eu tenha lhe dito que o valor estava próximo de , como entre 0 e 0,2 . Isso ajuda você a ler algumas probabilidades desses gráficos?0,10 00,2
Aluno : Claro, porque eu posso usar áreas. Eu só tenho que estimar as áreas abaixo de cada curva entre e 0,2 . Mas isso parece muito difícil.0 00,2
Professor : Você não precisa ir tão longe. Você pode apenas dizer qual área é a maior?
Aluno : Aquele abaixo da curva mais alta, é claro. Todas as três áreas têm a mesma base; portanto, quanto maior a curva, maior a área abaixo dela e da base. Isso significa que o histograma mais alto - o que eu desenhei, com os traços vermelhos - é o mais provável para um deslocamento de . Acho que vejo aonde você está indo com isso, mas estou um pouco preocupado: não preciso procurar todos os histogramas para todas as alternativas, não apenas a uma ou duas mostradas aqui? Como eu poderia fazer isso?0,1
Professor : Você é bom em captar padrões, então me diga: como o aparelho de medição é cada vez mais preciso, o que acontece com o histograma?
Aluno : Ele fica mais estreito - ah, e também tem que ficar mais alto, para que sua área total permaneça a mesma. Isso torna muito difícil comparar os histogramas. As alternativas são todas mais altas do que o nulo à direita em , isso é óbvio. Mas, em outros valores, às vezes as alternativas são mais altas e às vezes são menores! Por exemplo, [apontando para um valor próximo de 3 / 4 ], aqui a minha histograma vermelho é o mais baixo, o histograma amarelo é o mais alto, e o histograma nula original está entre eles. Mas, à direita, o nulo é o mais alto.0 03 / 4
Professor : Em geral, comparar histogramas é um negócio complicado. Para nos ajudar, pedi ao computador que fizesse outro gráfico: dividiu cada uma das alturas alternativas do histograma (ou "densidades") pela altura nula do histograma, criando valores conhecidos como "razões de verossimilhança". Como resultado, um valor maior que significa que a alternativa é mais provável, enquanto um valor menor que 1 significa que a alternativa é menos provável. Ele desenhou mais uma alternativa: é mais espalhada que as outras duas, mas ainda menos espalhada que o aparelho original.11
Professor (continuação): Você poderia me mostrar onde as alternativas tendem a ser mais prováveis que as nulas?
Aluno (colorindo): Aqui no meio, obviamente. E como esses não são mais histogramas, acho que devemos olhar para as alturas, e não para as áreas, então estou apenas marcando uma faixa de valores no eixo horizontal. Mas como sei quanto do meio deve ser colorido? Onde eu paro de colorir?
Professor : Não existe uma regra firme. Tudo depende de como planejamos usar nossas conclusões e de quão ferozes são os céticos. Mas sentar e pensar sobre o que você tem feito: agora você percebe que os resultados obtidos com razões de probabilidade grandes são evidência para a alternativa e os resultados com razões de probabilidade pequenas são evidência contra a alternativa. O que vou pedir para você fazer é colorir em uma área que, na medida do possível, tenha uma pequena chance de ocorrer sob a hipótese nula e uma chance relativamente grande de ocorrer sob as alternativas. Voltando ao primeiro diagrama que você pintou, bem no começo de nossa conversa, você pintou as duas caudas do nulo porque eram "extremas". Eles ainda fariam um bom trabalho?
Aluno : Acho que não. Mesmo sendo bastante extremos e raros sob a hipótese nula, são praticamente impossíveis para qualquer uma das alternativas. Se minha nova medida fosse, digamos , acho que ficaria do lado do cético e negaria que alguma melhoria tivesse ocorrido, mesmo que 3.0 tenha sido um resultado incomum em qualquer caso. Eu quero mudar essa coloração. Aqui - deixe-me tomar outro giz de cera.3.03.0
Professor : O que isso representa?
Aluno : Começamos com você me pedindo para desenhar apenas 10% da área sob o histograma original - o que descreve o nulo. Então agora eu atraí 10% da área onde as alternativas parecem mais prováveis de ocorrer. Eu acho que quando uma nova medida é nessa área, está nos dizendo que devemos acreditar na alternativa.
Mestre : E como o cético deve reagir a isso?
Aluno : Um cético nunca tem que admitir que está errado, não é? Mas acho que a fé dele deve estar um pouco abalada. Afinal, organizamos para que, embora uma medida possa estar dentro da área que acabei de desenhar, ela só tem 10% de chance de estar lá quando o nulo for verdadeiro. E tem uma chance maior de estar lá quando a alternativa é verdadeira. Eu simplesmente não posso te dizer o quanto essa chance é maior, porque dependeria de quanto o cientista melhorasse o aparato. Eu apenas sei que é maior. Portanto, a evidência seria contra o cético.
Professor : Tudo bem. Você se importaria de resumir sua compreensão para que fiquemos perfeitamente claros sobre o que aprendeu?
Aluno : Aprendi que, para comparar hipóteses alternativas a nulas, devemos comparar seus histogramas. Dividimos as densidades das alternativas pela densidade do nulo: foi o que você chamou de "razão de verossimilhança". Para fazer um bom teste, devo escolher um número pequeno, como 10% ou o que for suficiente para abalar um cético. Então, devo encontrar valores em que a taxa de verossimilhança seja a mais alta possível e colori-los até que 10% (ou o que seja) tenha sido colorido.
Professor : E como você usaria essa coloração?
Aluno : Como você me lembrou anteriormente, a coloração deve estar entre as linhas verticais. Valores (no eixo horizontal) que ficam embaixo da coloração são evidências contra a hipótese nula. Outros valores - bem, é difícil dizer o que eles significam sem dar uma olhada mais detalhada em todos os histogramas envolvidos.
0,1
Aluno : Isso está na área que eu colori pela última vez, então acho que o cientista provavelmente estava certo e o aparato realmente foi melhorado.
Professor : Uma última coisa. Sua conclusão foi baseada em escolher 10% como critério ou "tamanho" do teste. Muitas pessoas gostam de usar 5%. Alguns preferem 1%. O que você poderia dizer a eles?
0 00,10,050,10,080,1. Eles não chegariam à mesma conclusão que eu: diriam que não há provas suficientes de que uma mudança realmente ocorreu.
0,08
Aluno : Obrigado. Ainda não estou confiante de que compreendi tudo isso, mas você me deu muito em que pensar.
Professor : Se você quiser ir além, dê uma olhada no lema Neyman-Pearson . Você provavelmente está pronto para entender isso agora.
Sinopse
ztt = 0,1
0 0t = 0,1é atingido. O valor p é a área da região sombreada sob o histograma nulo: é a chance, assumindo que o nulo é verdadeiro, de observar um resultado cujas razões de probabilidade tendem a ser grandes, independentemente de qual alternativa seja verdadeira. Em particular, essa construção depende intimamente da hipótese alternativa. Não pode ser realizado sem especificar as alternativas possíveis.