Qual será a resposta correta, se modificarmos a "Melhor pergunta sobre estatística de todos os tempos"?

8

Existe uma pergunta popular, chamada "Melhor pergunta de estatística de todos os tempos".

Se você escolher uma resposta para essa pergunta aleatoriamente, qual é a chance de estar correta?

A) 25% B) 50% C) 60% D) 25%

Esta tarefa não é muito difícil, a resposta correta é 0%. Mas se o modificarmos assim:

Se você escolher uma resposta para essa pergunta aleatoriamente, qual é a chance de estar correta?

A) 50% B) 25% C) 60% D) 50%

Qual será a resposta correta? Temos duas respostas corretas: 25% e 50%, ou não há resposta correta, pois com essas duas respostas corretas a chance de escolher a resposta correta é de fato 75% (mas não temos 75% escritos em cima da mesa )?

A propósito. A resposta 0% permanece correta, a terceira resposta correta neste caso?

probability paradox

— usuario
fonte

1

A resposta, é claro, depende de como é feita a escolha aleatória. "Ao acaso" nem sempre significa "uniformemente ao acaso" ...;)

— MånsT

Vamos assumir "uniformemente aleatoriamente". A lógica por trás da pergunta original era: como uma resposta 25% tem 50% de probabilidade de ser escolhida e uma resposta 50% e 60% tem 25% de probabilidade de ser escolhida, essas respostas não estão corretas. A resposta 0% está correta, pois a probabilidade de escolher é 0%.

— Nick

2

Este problema foi exaustivamente analisado em math.SE há algum tempo.

— cardeal

4

@ whuber: Aqui está aquele com mais votos . Havia outros, mas talvez eles tenham sido fechados / mesclados.

— cardeal

2

@ Cardinal Obrigado. Acho que estou feliz por ver que parece não haver respostas profundas ou esclarecedoras (apesar da votação pesada), porque significa que pode haver alguma margem para mais exegese aqui :-).

— whuber

11

Os aparentes paradoxos (de lógica ou probabilidade) podem ser resolvidos enquadrando as perguntas de forma clara e cuidadosa.

A análise a seguir é motivada pela idéia de defender uma resposta: quando um participante do teste pode exibir um possível estado de coisas (consistente com todas as informações disponíveis) em que sua resposta é realmente correta, deve ser marcado como correto. Equivalentemente, uma resposta está incorreta quando não existe tal defesa; é considerado correto caso contrário. Isso modela as interações usuais entre os alunos (benevolentes, racionais) e os alunos (racionais) :-). O aparente paradoxo é resolvido exibindo várias dessas defesas para a segunda questão, das quais apenas uma poderia ser aplicada em qualquer instância.

Vou pegar o significado de "aleatório" nessas perguntas no sentido convencional: para modelar uma escolha aleatória de resposta, escreverei cada resposta em um pedaço de papel ("bilhete") e colocarei em uma caixa: isso será total de quatro ingressos. Tirar um ingresso da caixa (depois de embaralhar o conteúdo da caixa com cuidado e cegamente) é um modelo físico para uma escolha "aleatória". Motiva e justifica um modelo de probabilidade correspondente .

Agora, o que significa "estar correto"? Na minha ignorância, explorarei todas as possibilidades. De qualquer forma, considero que zero, um ou mais tickets podem estar "corretos". (Como posso saber? Simplesmente consulte a folha de classificação!) Marcarei as respostas "corretas" como tal, escrevendo o valor em cada ticket correto e escrevendo nos outros. Isso é rotina e não deve ser controverso. $1$ $0$

Uma coisa óbvia, mas importante a ser observada, é que a regra para escrever ou deve se basear apenas na resposta escrita em cada ticket: matematicamente, é um mapeamento (ou reatribuição) enviando o conjunto de respostas listadas ( em ambas as perguntas) no conjunto . Esta regra é necessária para a autoconsistência. $0$ $1$ $\{.25, .50, .60\}$ $\{0,1\}$

Vamos voltar ao elemento probabilístico da questão: por definição, a chance de estar correta, sob um sorteio aleatório de tickets, é a expectativa dos valores com os quais eles foram marcados. A expectativa é calculada somando os valores nos tickets e dividindo-os pelo número total. Portanto, será , , , ou . $0$ $.25$ $.50$ $.75$ $1$

Uma marcação fará sentido, desde que apenas os tickets cujas respostas sejam iguais às expectativas sejam marcados com s $1$ . Este também é um requisito de autoconsistência. Afirmo que este é o cerne da questão: encontrar e interpretar as marcações que fazem sentido. Se não houver, então a própria pergunta pode ser marcada como sem sentido. É uma marcação única, então não haverá controvérsia. Somente se duas ou mais marcações fizerem sentido, haverá alguma dificuldade em potencial.

Quais marcações fazem sentido?

Nem precisamos fazer uma pesquisa exaustiva. Na primeira pergunta , as expectativas listadas nos ingressos são de 25%, 50% e 60%. O último é impossível com quatro ingressos. O primeiro exigiria exatamente um ticket para ser marcado; o segundo, dois ingressos. Isso dá no máximo marcações possíveis para explorar. A única marcação que faz sentido coloca s em cada ticket. Para esta marcação, a expectativa é . Isso justifica a resposta declarada à primeira pergunta. (Indiscutivelmente, a única resposta correta para a primeira pergunta é não selecionar nenhuma resposta!) $3+3=6$ $0$ $(0+0+0+0)/4 = 0$

Na segunda pergunta , as mesmas respostas aparecem e mais uma vez há seis marcações a serem exploradas. Desta vez, três marcações são auto-consistentes. Eu os tabulo:

Solution 1                Solution 2                Solution 3
Ticket Answer Mark        Ticket Answer Mark        Ticket Answer Mark
     A    50%    1             A    50%    0             A    50%    0
     B    25%    0             B    25%    1             B    25%    0
     C    60%    0             C    60%    0             C    60%    0
     D    50%    1             D    50%    0             D    50%    0

Portanto, existem três definições possíveis distintas de "correto" no segundo problema, levando A ou D a estarem corretos (na solução 1) ou apenas B a estar correto (na solução 2) ou nenhuma das respostas estar correta (em solução 3).

Uma maneira de interpretar esse estado de coisas é que, para cada uma das respostas A, B e D, existe pelo menos uma maneira de marcar os tickets que corrigem essas respostas. Isso não implica que todos os três estejam simultaneamente corretos: não poderiam estar, porque . Se você fosse o avaliador do teste, se marcasse A, B ou D como correto, não receberia uma discussão do examinador; mas se você marcou algum deles incorreto, $.25 \ne .50$ o participante do teste teria uma base legítima para contestar sua pontuação: invocaria a solução 1 ou a solução 2. De fato, se um participante do teste se recusasse a responder à pergunta, a solução 3 daria a ele uma base legítima para argumentar que sua não -response também deve receber crédito total!

Em resumo, essa análise aborda a segunda parte da questão, concluindo que qualquer uma das seguintes respostas à pergunta 2 deve ser marcada como correta, pois cada uma delas é defensável : A, B, D, A e D e nada. Nenhuma outra resposta pode ser defendida e, portanto, não estaria correta.

— whuber
fonte

1

Então, qual é a sua resposta para a pergunta 2? Parece que você deu uma explicação imensamente complicada com três possíveis respostas consistentes. Eu ainda mantenho que isso indica um problema com a definição de correto.

— Michael R. Chernick

2

@ Michael Obrigado: adicionei um parágrafo para tornar as conclusões perfeitamente claras. Admito que elaborar uma resposta relativamente longa (que talvez seja justificada pelo comprimento coletivo muito maior de respostas aqui e no site de matemática). "Imensamente complicado" deve estar nos olhos de quem vê: trabalhei para tornar as idéias o mais objetivas possível, para que os leitores possam verificar facilmente se não estou tentando enganá-las. Quando outros afirmam que há um "paradoxo" ou uma "questão na lógica", é essencial ser simples, claro e explícito, embora isso possa aumentar a duração.

— whuber

1

@ Michael, eu aprecio isso. Eu mesmo sou um pouco desconfiado com essa resolução, porque as pessoas não se sentem confortáveis com a ideia de que pode haver várias respostas corretas para esclarecer perguntas simples. Convido a avaliação crítica dessa idéia de "defensibilidade" como uma maneira de contornar o aparente paradoxo. Para mim, parece uma maneira original de contornar as conclusões negativas alcançadas por outros (a saber, que a segunda pergunta é sem sentido, ou sem sentido, ou ilógica). O principal valor da análise de paradoxos reside no incentivo a um exame mais profundo das idéias fundamentais.

— whuber

1

Ah, esse é o ponto, @ Michael: embora os três sejam contraditórios, cada um é defensável. Forneci a defesa na explicação que antecedeu as soluções tabuladas. Vamos ser práticos aqui: imagine que você é professor de uma instituição da Ivy League (onde os alunos e seus pais, infelizmente, se tornaram bastante litigiosos nos últimos anos) e você fez essas perguntas como parte de um exame. Como você os classifica? Minha análise sugere uma maneira racional, objetiva, justa e evita discussões entre professor e aluno - mesmo que os alunos possam diferir entre si!

— whuber

2

Esse é o seu problema, @ Michael: a suposição de que deve haver uma resposta única para uma pergunta de múltipla escolha. (Converse com os médicos que você conhece e pergunte a eles sobre as questões de múltipla escolha nos exames de certificação do conselho: pelo menos no passado, várias respostas a cada pergunta estariam corretas.) Aqui, a presença de duas respostas idênticas à segunda pergunta indica a possibilidade de que mais de uma resposta a uma pergunta possa ser considerada correta.// Neste momento, parecemos o risco de nos afastarmos do problema; portanto, se você tiver outras observações, inicie uma sala de bate-papo.

— whuber

9

Eu acho que há uma questão de semântica aqui, além da probabilidade. A escolha aleatória é clara. Cada um de A, B, C e D será selecionado 25%. Mas o que significa estar correto quando você escolhe aleatoriamente? Parece que isso deve significar, dado que você escolhe A como resposta, dê a% correta de amostras que serão corretas e iguais para B, C e D. Portanto, você deve contar 1/4 para cada resposta correta e somar todas as respostas corretas para obter a porcentagem correta. Mas isso leva a um argumento circular. Daí o paradoxo. Isso realmente parece ser uma questão de lógica, e não de probabilidade ou estatística.

— Michael R. Chernick
fonte

1

+1. Eu estava me perguntando "Mas o que significa estar correto ...?". Concordo que isso parece ser mais um quebra-cabeça lógico do que uma questão de probabilidade (embora eu gostaria de ouvir uma explicação de alguém sobre por que essa percepção está errada).

— Macro

A lógica por trás da pergunta original era exatamente como você descreveu. Como uma resposta 25% tem 50% de probabilidade de ser escolhida, e uma respostas 50% e 60% tem 25% de probabilidade de ser escolhida, essas respostas não estão corretas. A resposta 0% está correta, pois a probabilidade de escolher é 0%. Isso lembra um argumento circular, mas isso torna a pergunta incorreta?

— Nick

@ Nick Acho que não. Eu acho que o argumento circular o torna indeterminado. Você não pode dizer quais respostas estão corretas e não pode dizer quais respostas estão incorretas. Então 0% não é a resposta. A pergunta não pode ser respondida. Talvez você possa dizer que 60% está incorreto porque, se houvesse uma resposta, teria que ser múltiplo de 1/4.

— Michael R. Chernick

1

O whuber oferece uma ótima análise, onde várias respostas são permitidas. No entanto, também existe uma maneira consistente de entender a pergunta, de modo que exista apenas uma única resposta correta (embora seja necessário declarar isso como parte da pergunta):

Se você escolher uma resposta para essa pergunta aleatoriamente, qual é a chance de estar correta, considerando que existe apenas uma única resposta correta?

A) 50% B) 25% C) 60% D) 50%

$\{0,1\}$

Solution 1                Solution 2                Solution 3
Ticket Answer Mark        Ticket Answer Mark        Ticket Answer Mark
     A    50%    1             A    50%    0             A    50%    0
     B    25%    0             B    25%    1             B    25%    0
     C    60%    0             C    60%    0             C    60%    0
     D    50%    1             D    50%    0             D    50%    0

No entanto, precisamos de outro passo lógico para reduzi-los a uma única resposta defensável. Ao fazer esse problema, o professor foi confrontado com três possíveis marcações, cada uma das quais poderia ser a mesma resposta aceitável que as outras. No entanto, como apenas uma resposta pode estar correta, o professor deve escolher aleatoriamente entre eles. Isso atribui uma probabilidade igual a cada marcação para que:

$1/3$ $50\%$
$1/3$ $25\%$
$1/3$ $0\%$

$(50+25+0)/3=25$

Resumo: se especificarmos que existe apenas uma única resposta correta, essa resposta será de 25%.

— WJ Zeng
fonte

Você poderia explicar a justificativa para "No entanto, como apenas uma resposta pode estar correta, o professor deve escolher aleatoriamente entre eles"? Não vejo por que uma escolha aleatória é necessária neste momento.

— whuber

É claro que é possível que o professor tenha algum tipo de viés, mas não há razão para pensar que exista um. Na completa ausência de qualquer outra informação, acho que o racional antes de assumir é que a escolha segue uma distribuição uniforme. Deixe-me saber se isso parece errado.

— WJ Zeng

Não sei se está enganado ou não, mas chamá-lo de "o prior racional" não parece nenhuma explicação. O que me incomoda é que "especificar que existe apenas uma única resposta correta" pode ser inerentemente contraditório, caso em que nenhuma distribuição anterior será relevante. Além disso, o esquema lógico do seu argumento parece ser "se assumirmos que há uma única resposta correta e também adotarmos uma distribuição prévia entre as três possíveis respostas corretas, então concluiremos que há uma resposta correta única". Parece terrivelmente circular, mas talvez possa ser corrigido.

— whuber

0

Eu acredito que a resposta é 1/3. Não sabemos qual resposta (25%, 50% ou 60%) está correta. Portanto, cada resposta, 25%, 50% e 60%, tem 1/3 de chance de estar correta, se selecionada. Mesmo que 25% apareça duas vezes, ainda tem 1/3 de chance de ser a resposta correta. Na verdade, não importa quantas vezes 25% aparece como resposta. Se aparecer 10 vezes junto com os 50% e os 60%, a chance de ser a resposta correta ainda será 1/3. Isso pressupõe que uma das respostas esteja correta. Se houver a possibilidade de nenhuma das respostas estar correta, a resposta será 1/4. Isso se baseia na minha interpretação do que a pergunta está fazendo.

— Jamie
fonte

1

Essa tentativa de explicação falha porque confunde a ignorância de forma inválida (não sabemos qual das três respostas estaria correta) com a probabilidade (atribuindo 1/3 a cada resposta).

— whuber