Originalmente, publiquei o seguinte como resposta parcial a uma pergunta, perguntando por que um intervalo de confiança de 95% não implica que haja uma chance de 95% de que o intervalo contenha a média verdadeira (consulte: Por que um intervalo de confiança de 95% (IC) não é implica uma chance de 95% de conter a média? ). Um comentarista (graças a John) me pediu posteriormente para postar o comentário como uma pergunta separada, então aqui vai.
Primeiramente, vou assumir que, se eu selecionar uma carta de baralho aleatoriamente em um baralho padrão, a probabilidade de eu ter selecionado um clube (sem olhar para ela) é 13/52 = 25%.
Em segundo lugar, já foi afirmado muitas vezes que um intervalo de confiança de 95% deve ser interpretado em termos de repetir um experimento várias vezes e o intervalo calculado conterá a verdadeira média em 95% das vezes - acho que isso foi demonstrado de forma razoavelmente convincente por James Waters simulação na questão vinculada acima. A maioria das pessoas parece aceitar essa interpretação de um IC de 95%.
Agora, para o experimento mental. Vamos supor que tenhamos uma variável normalmente distribuída em uma grande população - talvez alturas de machos ou fêmeas adultos. Tenho um assistente disposto e incansável, encarregado de executar vários processos de amostragem de um determinado tamanho de amostra da população e calcular a média da amostra e o intervalo de confiança de 95% para cada amostra. Meu assistente é muito afiado e consegue medir todas as amostras possíveis da população. Em seguida, para cada amostra, meu assistente registra o intervalo de confiança resultante como verde (se o IC contiver a média verdadeira) ou vermelho (se o IC não contiver a média verdadeira). Infelizmente, meu assistente não vai me mostrar os resultados de seus experimentos. Preciso obter algumas informações sobre as alturas dos adultos na população, mas só tenho tempo, recursos e paciência para fazer o experimento uma vez. Faço uma única amostra aleatória (do mesmo tamanho de amostra usada pelo meu assistente) e calculo o intervalo de confiança (usando a mesma equação).
Não tenho como ver os resultados do meu assistente. Então, qual é a probabilidade de que a amostra aleatória que eu selecionei produza um IC verde (ou seja, o intervalo contém a média verdadeira)?
Na minha opinião, isso é o mesmo que a situação do baralho de cartas descrita anteriormente e pode ser interpretado que existe uma probabilidade de 95% de que o intervalo calculado usando minha amostra seja verde (ou seja, contenha a verdadeira média). E, no entanto, o consenso parece ser que um intervalo de confiança de 95% NÃO pode ser interpretado, pois existe uma probabilidade de 95% de que o intervalo contenha a média verdadeira. Por que (e onde) meu raciocínio no experimento de pensamento acima se desfaz?