Paradoxos estatísticos mais interessantes

112

Como os acho fascinantes, gostaria de ouvir o que as pessoas desta comunidade consideram o paradoxo estatístico mais interessante e por quê.

paradox

— Nick
fonte

11

Alguns pequenos exemplos, especialmente no contexto da pesquisa, aqui: filipspagnoli.wordpress.com/category/statistics/…

— Charlie

100

Não é um paradoxo em si , mas é um comentário intrigante, pelo menos a princípio.

Durante a Segunda Guerra Mundial, Abraham Wald foi estatístico do governo dos EUA. Ele olhou para os bombardeiros que retornavam das missões e analisou o padrão das balas "feridas" nos aviões. Ele recomendou que a Marinha reforçasse áreas onde os aviões não apresentavam danos.

Por quê? Temos efeitos de seleção no trabalho. Esta amostra sugere que os danos infligidos nas áreas observadas poderiam ser resistidos. Os aviões nunca foram atingidos nas áreas intocadas, uma proposição improvável ou os ataques a essas partes foram letais. Preocupamo-nos com os aviões que caíram, não apenas com os que retornaram. Aqueles que caíram provavelmente sofreram um ataque em um local que não foi tocado pelos que sobreviveram.

Para cópias de seus memorandos originais, veja aqui . Para uma aplicação mais moderna, consulte esta postagem no blog da Scientific American .

Expandindo um tema, de acordo com este post do blog , durante a Primeira Guerra Mundial, a introdução de um capacete de estanho levou a mais ferimentos na cabeça do que um chapéu de pano comum. O novo capacete foi pior para os soldados? Não; embora as lesões fossem maiores, as mortes eram menores.

— Charlie
fonte

3

Lembro-me de ter lido isso em alguns lugares antes, mas não tenho uma referência em mãos. Existe um que você pode adicionar?

— cardeal

11

@ cardinal, encontrei alguns memorandos para você. Parece que a pesquisa foi realmente para os EUA.

— Charlie

Em algum lugar, há um gráfico de dispersão de um avião hipotético para este exemplo, mas não consigo encontrá-lo.

— fomite

+1. Este é um exemplo de viés de sobrevivência , talvez o mais prejudicial dos viés. Eu a expandi em uma resposta.

— Cliff AB

47

Outro exemplo é a falácia ecológica .

Exemplo
Suponha que procuremos uma relação entre votação e renda regredindo a parcela de votos do então senador Obama sobre a renda mediana de um estado (em milhares). Temos um intercepto de aproximadamente 20 e um coeficiente de inclinação de 0,61.

Muitos interpretariam esse resultado como dizendo que pessoas com renda mais alta têm maior probabilidade de votar nos democratas; de fato, os livros de imprensa populares fizeram esse argumento.

Mas espere, pensei que era mais provável que os ricos fossem republicanos? Eles são.

O que essa regressão está realmente nos dizendo é que os estados ricos têm mais probabilidade de votar em um democrata e os estados pobres têm mais probabilidade de votar em um republicano. Dentro de um determinado estado , as pessoas ricas têm mais chances de votar nos republicanos e as pobres têm mais chances de votar nos democratas. Veja o trabalho de Andrew Gelman e seus co-autores .

Sem outras suposições, não podemos usar dados em nível de grupo (agregados) para fazer inferências sobre o comportamento em nível individual. Essa é a falácia ecológica. Os dados no nível do grupo podem nos informar apenas sobre o comportamento no nível do grupo.

Para dar um salto para inferências em nível individual, precisamos da suposição de constância . Aqui, a escolha do voto dos indivíduos não varia sistematicamente com a renda mediana de um estado; uma pessoa que ganha $ X em um estado rico deve ter a mesma probabilidade de votar em um democrata do que alguém que ganha $ X em um estado pobre. Mas as pessoas em Connecticut, em todos os níveis de renda, são mais propensas a votar em um democrata do que as pessoas no Mississippi nesses mesmos níveis de renda . Portanto, a suposição de consistência é violada e somos levados à conclusão errada (enganados pelo viés de agregação ).

Este tópico era um cavalo-marinho frequente do falecido David Freedman ; veja este documento , por exemplo. Nesse artigo, Freedman fornece um meio para limitar probabilidades em nível individual usando dados de grupo.

Comparação com o paradoxo de Simpson
Em outra parte desta CW, @Michelle propõe o paradoxo de Simpson como um bom exemplo, como realmente é. O paradoxo de Simpson e a falácia ecológica estão intimamente relacionados, mas são distintos. Os dois exemplos diferem na natureza dos dados fornecidos e nas análises utilizadas.

A formulação padrão do paradoxo de Simpson é uma tabela de mão dupla. Em nosso exemplo aqui, suponha que tenhamos dados individuais e classifiquemos cada indivíduo como alta ou baixa renda. Obteríamos uma tabela de contingência 2x2 de renda por voto dos totais. Veríamos que uma parcela maior de pessoas de alta renda votava no democrata em relação à parcela de pessoas de baixa renda. Se criarmos uma tabela de contingência para cada estado, no entanto, veremos o padrão oposto.

Na falácia ecológica, não colapsamos a renda em uma variável dicotômica (ou talvez multicotômica). Para chegar ao nível estadual, obtemos a participação média (ou mediana) da renda e do voto do estado e fazemos uma regressão e descobrimos que os estados de maior renda têm maior probabilidade de votar no democrata. Se mantivéssemos os dados no nível individual e executássemos a regressão separadamente por estado, encontraríamos o efeito oposto.

Em resumo, as diferenças são:

Modo de análise : Poderíamos dizer, seguindo nossas habilidades de preparação para o SAT, que o paradoxo de Simpson é para tabelas de contingência, pois a falácia ecológica é para coeficientes de correlação e regressão.
Grau de agregação / natureza dos dados : enquanto o exemplo do paradoxo de Simpson compara dois números (participação do voto democrata entre indivíduos de alta renda versus o mesmo para indivíduos de baixa renda), a falácia ecológica usa 50 pontos de dados ( ou seja , cada estado) para calcular um coeficiente de correlação . Para obter a história completa do exemplo do paradoxo de Simpson, precisaríamos apenas dos dois números de cada um dos cinquenta estados (100 números), enquanto no caso de falácia ecológica, precisamos dos dados em nível individual (ou então, ser dados correlações em nível de estado / inclinações de regressão).

Observação geral O
@NeilG comenta que isso parece estar dizendo que você não pode ter nenhuma seleção sobre problemas de viés de variáveis não observáveis / omitidas em sua regressão. Está certo! Pelo menos no contexto da regressão, acho que quase qualquer "paradoxo" é apenas um caso especial de viés de variáveis omitidas.

O viés de seleção (veja minha outra resposta neste CW) pode ser controlado incluindo as variáveis que conduzem a seleção. Obviamente, essas variáveis normalmente não são observadas, direcionando o problema / paradoxo. A regressão espúria (minha outra outra resposta) pode ser superada adicionando uma tendência temporal. Esses casos dizem, essencialmente, que você tem dados suficientes, mas precisa de mais preditores.

No caso da falácia ecológica, é verdade, você precisa de mais preditores (aqui, inclinações e interceptações específicas do estado). Mas você precisa de mais observações, individuais, e não de grupo, para estimar esses relacionamentos.

(Aliás, se você tiver uma seleção extrema em que a variável de seleção divida perfeitamente tratamento e controle, como no exemplo da Segunda Guerra Mundial que eu dou, você pode precisar de mais dados para estimar a regressão também; aí, os planos abatidos.)

— Charlie
fonte

Como é possível formalizar a suposição de consistência ? Parece assumir que não há fatores de confusão (causais) ausentes no modelo de alguém.

— Neil G

2

Além disso, o exemplo fornecido também é um exemplo do paradoxo de Simpson, porque o condicionamento ao estado inverte a correlação entre renda e partido. Quando a falácia ecológica é diferente do paradoxo de Simpson?

— Neil G

Eu também apontaria que fazer inferências sobre associações ou causações em nível de grupo com base em associações ou relações causais em nível individual também é ruim: a falácia atomística, bem articulada aqui: [Diez-Roux, 1998] Diez-Roux, AV (1998). Trazendo o contexto de volta à epidemiologia: variáveis e falácias na análise multinível. American Journal of Public Health , 88 (2): 216–222.

— Alexis

43

Minha contribuição é o paradoxo de Simpson porque:

as razões do paradoxo não são intuitivas para muitas pessoas, então
pode ser muito difícil explicar por que as descobertas são do jeito que são para leigos em inglês comum.

Versão do paradoxo: a significância estatística de um resultado parece diferir dependendo de como os dados são particionados. A causa geralmente parece dever-se a uma variável confusa.

Outro bom esboço do paradoxo está aqui .

— Michelle
fonte

4

+1, pensei em colocar isso sozinho. Para aqueles que estão interessados, o paradoxo de Simpson também é discutido no CV aqui: stats.stackexchange.com/questions/21896

— gung

3

Existem alguns exemplos de paradoxo de Simpson mencionadas na presente questão math.SE .

— 21812 Mike Spivey

32

Não há paradoxos nas estatísticas, apenas quebra-cabeças aguardando solução.

No entanto, o meu favorito é o "envelope" de dois envelopes . Suponha que eu coloque dois envelopes na sua frente e diga que um contém o dobro do dinheiro que o outro (mas não qual é qual). Você raciocina da seguinte maneira. Suponha que o envelope esquerdo contenha , e com 50% de probabilidade, o envelope direito contenha e com 50% de probabilidade contenha , para um valor esperado de . Mas é claro que você pode simplesmente inverter os envelopes e concluir que o envelope esquerdo contém vezes o valor do envelope certo. O que aconteceu? $x$ $2x$ $0.5x$ $1.25x$ $1.25$

— Alex Flint
fonte

paradoxo brilhante - curiosamente, se formos com a "segunda" interpretação na wikipedia e tentarmos calcular , descobrimos que, para evitar a preferência pela troca, precisamos de que . Resolver para significa que obtemos . Da mesma forma, podemos calcular onde e obter .... Bizzare!

E [B | A = a]

$E[B|A=a]$

E [B | A = a] = a = 2 a p + \frac{a}{2} (1 - p)

$E[B|A=a]=a=2ap+\frac{a}{2}(1-p)$

p = P r (A < B | A = a)

$p=Pr(A<B|A=a)$

p

$p$

p = \frac{1}{3}

$p=\frac{1}{3}$

E [A | B = b] = b = 2 b q + \frac{b}{2} (1 - q)

$E[A|B=b]=b=2bq+\frac{b}{2}(1-q)$

q = P r (B < A | B = b)

$q=Pr(B<A|B=b)$

q = \frac{1}{3}

$q=\frac{1}{3}$

— probabilityislogic

6

Fiz apresentações sobre esse paradoxo em que o jogo é realmente jogado com o público, com quantias reais de dinheiro (geralmente um cheque para a instituição anfitriã). Ele chama a atenção deles ...

— whuber

Acho que resolvi este ... O paradoxo é resolvido quando reconhecemos os dois envelopes que o paradoxo propõe incorretamente 1) existem três quantidades possíveis: 0,5x, xe 2x, quando existem apenas duas quantidades nos envelopes (digamos x e 2x) e 2) que sabemos a priori que o envelope esquerdo contém x (nesse caso, o envelope direito conteria 2x com 100% de certeza!). Dados os possíveis valores de x e 2x atribuídos aleatoriamente aos dois envelopes, a resposta correta é um valor esperado de 1,5x, independentemente de eu escolher o envelope esquerdo ou o envelope direito.

— robertf

3

@RobertF A situação é mais complicada. Suponha que se saiba que o dinheiro é distribuído nos dois envelopes da seguinte maneira. Jogue uma moeda justa até cair na cara e conte o número n de vezes que a moeda foi lançada. Coloque 2 ^ n dólares em um envelope e 2 ^ (n + 1) no outro. Agora você pode executar cálculos de expectativa muito exatos e ainda manter o paradoxo.

— Ittay Weiss

31

O Problema da Bela Adormecida .

Esta é uma invenção recente; foi bastante discutido em um pequeno conjunto de revistas de filosofia na última década. Existem defensores firmes de duas respostas muito diferentes (os "Halfers" e "Thirders"). Isso levanta questões sobre a natureza da crença, probabilidade e condicionamento e fez com que as pessoas invocassem uma interpretação da mecânica quântica de "muitos mundos" (entre outras coisas bizarras).

Aqui está a declaração da Wikipedia:

A Bela Adormecida se oferece para se submeter à experiência a seguir e recebe todos os detalhes a seguir. No domingo, ela é colocada para dormir. Uma moeda justa é então lançada para determinar qual procedimento experimental é realizado. Se a moeda aparecer, Beauty será despertada e entrevistada na segunda-feira e o experimento será encerrado. Se a moeda aparecer, ela é despertada e entrevistada na segunda e terça-feira. Mas quando ela é colocada para dormir novamente na segunda-feira, ela recebe uma dose de um medicamento indutor de amnésia que garante que ela não se lembra do seu despertar anterior. Nesse caso, o experimento termina depois que ela é entrevistada na terça-feira.

Sempre que a Bela Adormecida é despertada e entrevistada, ela é questionada: "Qual é a sua credibilidade agora para a proposição de que a moeda caiu cara?"

A posição Thirder é que SB deve responder "1/3" (este é um cálculo simples do Teorema de Bayes) e a posição Halfer é que ela deve dizer "1/2" (porque essa é a probabilidade correta de uma moeda justa, obviamente! ) IMHO, todo o debate repousa sobre uma compreensão limitada da probabilidade, mas não é esse o objetivo de explorar aparentes paradoxos?

Príncipe Florimond encontra a bela adormecida

(Ilustração do Projeto Gutenberg .)

Embora este não seja o lugar para tentar resolver paradoxos - apenas para indicá-los -, não quero deixar as pessoas presas e tenho certeza de que a maioria dos leitores desta página não deseja examinar as explicações filosóficas. Podemos dar uma dica de ET Jaynes , que substitui a pergunta “como podemos construir um modelo matemático do senso comum humano” - que é algo de que precisamos para pensar no problema da Bela Adormecida - por “Como podemos construir uma máquina que executaria um raciocínio plausível útil, seguindo princípios claramente definidos que expressam um senso comum idealizado? ”Assim, se você preferir, substitua SB pelo robô pensante de Jaynes. Você pode clonareste robô (em vez de administrar uma droga amnésica fantástica) para a parte terça-feira do experimento, criando assim um modelo claro da configuração do SB que pode ser analisada sem ambiguidade. Modelar isso de maneira padrão, usando a teoria da decisão estatística, revela que realmente há duas perguntas sendo feitas aqui ( qual é a chance de uma moeda justa cair cara? E qual é a chance de a moeda cair cara, dependendo do fato de você ser o clone que foi acordado? ). A resposta é 1/2 (no primeiro caso) ou 1/3 (no segundo, usando o Teorema de Bayes). Nenhum princípio da mecânica quântica estava envolvido nesta solução :-).

Referências

Arntzenius, Frank (2002). Reflexões sobre a Bela Adormecida . Análise 62,1 pp 53-62. Elga, Adam (2000). Crença de auto-localização e o problema da Bela Adormecida. Análise 60 pp 143-7.

Franceschi, Paul (2005). A Bela Adormecida e o Problema da Redução Mundial . Pré-impressão.

Groisman, Berry (2007). O fim do pesadelo da Bela Adormecida .

Lewis, D. (2001). A Bela Adormecida: responda a Elga . Análise 61,3 pp 171-6.

Papineau, David e Victor Dura-Vila (2008). Uma sede e um Everettiano: uma resposta à 'Quantum Sleeping Beauty' de Lewis .

Pust, Joel (2008). Horgan sobre a Bela Adormecida . Synthese 160 pp 97-101.

Vineberg, Susan (sem data, talvez 2003). Conto preventivo da beleza .

Tudo pode ser encontrado (ou pelo menos foi encontrado há vários anos) na Web.

— whuber
fonte

11

Você acha que é igualmente eficaz formular a solução em termos de "unidades base"? Com isso quero dizer, você deve considerar se a unidade base é a pessoa ou a entrevista. 1/2 das pessoas terão cabeça, mas 1/3 das entrevistas terão. Em seguida, para escolher nossa unidade base, podemos revisitar a pergunta e a frase como "Qual é a chance de esta entrevista estar associada a um resultado de 'cabeças' '?"

— 31412 Jonathan

11

SB não sabe quantas entrevistas houve e a pergunta é sobre sua avaliação da probabilidade, não sobre a avaliação dos pesquisadores. Do seu ponto de vista, o número de entrevistas não pode ser determinado.

— whuber

2

Eu acho que você deveria ler os argumentos da literatura primeiro, Aaron. (Confesso que sou um thirder, mas acho que os halfers não vai encontrar o seu raciocínio convincente No mínimo, você precisa mostrar-lhes porque seu argumento é falho..)

— whuber

11

Ponto justo, @whuber, agora eu tenho uma visão mais aprofundada da literatura. Estou lendo a Bela Adormecida de Ellis : responda a Elga . É essa frase que me preocupa, no início da seção '4. O meu argumento '. "Somente novas evidências relevantes, centradas ou não, produzem uma mudança de credibilidade". Pensarei mais e talvez escreva sobre isso novamente. Eu tive uma longa discussão com outros sete estudantes de doutorado sobre isso!

— Aaron McDaid

11

A Bela Adormecida pode ver o calendário quando acordada? Se segunda-feira, ela deve responder P (X = cabeça) = 0,5. Se terça-feira, então P (X = cabeça) = 0.

— robertf

25

O paradoxo de São Petersburgo , que faz você pensar de maneira diferente no conceito e significado do Valor Esperado . A intuição (principalmente para pessoas com formação em estatística) e os cálculos estão dando resultados diferentes.

— Guy
fonte

5

X_{1}, X_{2}, \dots

$X_1,X_2,\ldots$

\sqrt{n} {\bar{X}}_{n}

$\sqrt{n} \bar X_n$

N (0, 1)

$\mathcal N(0,1)$

V a r (\sqrt{n} {\bar{X}}_{n}) \to 17

$\mathrm{Var}(\sqrt{n} \bar X_n) \to 17$

@ cardinal Alguma chance de você postar alguns detalhes disso como uma resposta separada?

— Silverfish

X_{i}

$X_i$

f (n)

$f(n)$

f

$f$

Var (\sqrt{n} {\bar{X}}_{n})

$\text{Var}(\sqrt{n}\bar X_n)$

X_{i}

$X_i$

f (i)

$f(i)$

X_{i}

$X_i$

V a r (\sqrt{n} {\bar{X}}_{n}) = \frac{1}{n} \sum_{i = 1}^{n} f (i)

$\mathrm{Var}(\sqrt{n}\bar X_n) = \frac{1}{n}\sum_{i=1}^n f(i)$

f (i)

$f(i)$

V a r (\sqrt{n} {\bar{X}}_{n})

$\mathrm{Var}(\sqrt{n}\bar X_n)$

22

O paradoxo de Jeffreys-Lindley , que mostra que, em algumas circunstâncias, os métodos freqüentistas e bayesianos padrão de teste de hipóteses podem dar respostas completamente contraditórias. Realmente força os usuários a pensar exatamente sobre o significado dessas formas de teste e a considerar se é isso que realmente querem. Para um exemplo recente, veja esta discussão .

— convidado
fonte

20

Existe a famosa falácia de duas meninas:

Em uma família com dois filhos, quais são as chances, se um deles é menina , de os dois serem meninas?

A maioria das pessoas diz intuitivamente 1/2, mas a resposta é 1/3. A questão, fundamentalmente, é que escolher uniformemente "uma garota de todas as meninas com um irmão" aleatoriamente não é o mesmo que escolher uniformemente "uma família, de todas as famílias com dois filhos e pelo menos uma garota".

Essa é simples o suficiente para combinar com a intuição, depois que você a entender, mas há versões mais complicadas e mais difíceis de entender:

Em uma família com dois filhos, quais são as chances, se um deles é um menino nascido na terça-feira , de que ambos sejam meninos? (Resposta: 13/27)

Em uma família com dois filhos, quais são as chances, se um deles for uma menina chamada Florida , de que ambos sejam meninas? (Resposta: muito próximo de 1/2, assumindo que "Florida" seja um nome extremamente raro)

Mais informações sobre todos esses quebra-cabeças podem ser encontradas nesta resposta .
(Também: Mais informações sobre o menino nascido na terça-feira , mais informações sobre a garota chamada Florida )

— BlueRaja - Danny Pflughoeft
fonte

3

A resposta 1/3não é 2/3certamente? Apenas um fora deGB, BG, GG

— Martin Smith

3

O artigo "menino nascido na terça-feira" é bom. Seu ponto principal, que é exposto com muita clareza ("o problema está sub-definido"), é que a resposta depende do modelo de probabilidade adotado. Dizer que "a resposta" é 13/27 é enganoso (na melhor das hipóteses).

— whuber

@Martin: hehe whoops :)

— BlueRaja - Danny Pflughoeft

2

A razão pela qual esses problemas são tão confusos é que a pergunta está redigida de modo que é muito difícil determinar o que é o espaço de hipóteses. Isso, por sua vez, torna confuso o que realmente são os casos "igualmente prováveis" (e, portanto, o que deve ser contado).

— probabilityislogic

11

p (B_{1} G_{2}) = p (G_{1} B_{2})

$p(B_1G_2)=p(G_1B_2)$

\frac{p (G_{1} G_{2})}{2 p (B_{1} G_{2}) + p (G_{1} G_{2})}

$\frac{p(G_1G_2)}{2p(B_1G_2)+p(G_1G_2)}$

12

Desculpe, mas não consigo me conter (também amo paradoxos estatísticos!).

Novamente, talvez não seja um paradoxo em si e outro exemplo de viés de variáveis omitidas.

Causa / regressão espúrias
Qualquer variável com uma tendência temporal será correlacionada com outra variável que também tenha uma tendência temporal. Por exemplo, meu peso desde o nascimento até os 27 anos será altamente correlacionado com o seu peso, desde o nascimento até os 27 anos. Obviamente, meu peso não é causado pelo seu peso. Se fosse, eu pediria que você fosse à academia com mais frequência, por favor.

$x_t$ $y_t$

\begin{aligned} x_{t} & = α_{0} + α_{1} t + ϵ_{t} and \\ y_{t} & = β_{0} + β_{1} t + η_{t} . \end{aligned}

$\begin{align*}x_t &= \alpha_0 + \alpha_1 t + \epsilon_t \text{ and} \\ y_t &= \beta_0 + \beta_1 t + \eta_t.\end{align*}$

y_{t} = γ_{0} + γ_{1} x_{t} + ν_{t}

$\begin{equation*}y_t = \gamma_0 + \gamma_1 x_t + \nu_t\end{equation*}$

x_{t}

$x_t$

γ_{1}

$\gamma_1$

Ao executar a análise de séries temporais, você precisa ter certeza de que suas variáveis estão estacionárias ou obterá esses resultados de causalidade espúrios.

(Admito plenamente que plagiei minha própria resposta dada aqui .)

— Charlie
fonte

11

Um dos meus favoritos é o problema de Monty Hall. Lembro-me de aprender sobre isso em uma aula de estatística elementar, contando ao meu pai que, quando estávamos incrédulos, simulei números aleatórios e tentamos o problema. Para nossa surpresa, era verdade.

Basicamente, o problema afirma que, se você tivesse três portas em um game show, atrás das quais uma é um prêmio e as outras duas nada, se você escolhesse uma porta e depois soubesse das duas portas restantes, uma das duas não seria uma porta de premiação e você pode mudar sua escolha, se assim desejar, deve mudar sua porta atual para a porta restante.

Aqui também está o link para uma simulação R: LINK

— Tyler Rinker
fonte

7

Paradoxo de Parrondo:

Da wikipdedia : "O paradoxo de Parrondo, um paradoxo na teoria dos jogos, foi descrito como: Uma combinação de estratégias de perda se torna uma estratégia vencedora. É nomeado após seu criador, Juan Parrondo, que descobriu o paradoxo em 1996. Uma descrição mais explicativa é :

Existem pares de jogos, cada um com uma maior probabilidade de perder do que ganhar, para os quais é possível construir uma estratégia vencedora jogando os jogos alternadamente.

Parrondo concebeu o paradoxo em conexão com sua análise da catraca browniana, um experimento mental sobre uma máquina que supostamente pode extrair energia de movimentos aleatórios de calor popularizados pelo físico Richard Feynman. No entanto, o paradoxo desaparece quando analisado rigorosamente ".

$P_B(W)=3/4+\epsilon$ $P_A(W)=1/10 + \epsilon$

Há também um paradoxo relacionado mais recente chamado " mistura allison " , que mostra que podemos pegar duas séries de IDI e não correlacionadas e embaralhá-las aleatoriamente para que certas misturas possam criar uma série resultante com autocorrelação diferente de zero.

— pat
fonte

6

É interessante que o problema das duas crianças e o problema de Monty Hall sejam mencionados com frequência no contexto do paradoxo. Ambos ilustram um aparente paradoxo ilustrado pela primeira vez em 1889, chamado Box Paradox de Bertrand, que pode ser generalizado para representar qualquer um. Acho esse um "paradoxo" mais interessante, porque as mesmas pessoas muito educadas e muito inteligentes respondem a esses dois problemas de maneiras opostas em relação a esse paradoxo. Também se compara a um princípio usado em jogos de cartas como o bridge, conhecido como Princípio da Escolha Restrita, onde sua resolução é testada pelo tempo.

Digamos que você tenha um item selecionado aleatoriamente que chamarei de "caixa". Cada caixa possível possui pelo menos uma das duas propriedades simétricas, mas algumas possuem as duas. Vou chamar as propriedades de "ouro" e "prata". A probabilidade de uma caixa ser apenas ouro é P; e como as propriedades são simétricas, P também é a probabilidade de uma caixa ser apenas prata. Isso aumenta a probabilidade de que uma caixa tenha apenas uma propriedade 2P e a probabilidade de ter uma propriedade 2P.

Se lhe disserem que uma caixa é dourada, mas não se for prata, você pode ficar tentado a dizer que as chances de ser apenas ouro são P / (P + (1-2P)) = P / (1-P). Mas então você teria que declarar a mesma probabilidade para uma caixa de uma cor se lhe dissessem que era prata. E se essa probabilidade for P / (1-P) sempre que uma instrução lhe indicar uma cor, ela deverá ser P / (1-P), mesmo que você não saiba uma cor. No entanto, sabemos que é 2P do último parágrafo.

Esse aparente paradoxo é resolvido observando que, se uma caixa tiver apenas uma cor, não haverá ambiguidade sobre a cor que será informada. Mas se houver dois, há uma escolha implícita. Você precisa saber como essa escolha foi feita para responder à pergunta, e essa é a raiz do aparente paradoxo. Se não lhe disserem, você pode apenas assumir que uma cor foi escolhida aleatoriamente, tornando a resposta P / (P + (1-2P) / 2) = 2P. Se você insiste que P / (1-P) é a resposta, está implicitamente assumindo que não havia possibilidade de a outra cor ter sido mencionada, a menos que fosse a única cor.

No problema de Monty Hall, a analogia para as cores não é muito intuitiva, mas P = 1/3. As respostas baseadas nas duas portas fechadas originalmente com a mesma probabilidade de receber o prêmio estão assumindo que Monty Hall era obrigado a abrir a porta que ele abriu, mesmo que ele tivesse uma escolha. Essa resposta é P / (1-P) = 1/2. A resposta que lhe permite escolher aleatoriamente é 2P = 2/3 para a probabilidade de que a troca ganhe.

No Problema dos Dois Filhos, as cores na minha analogia se comparam muito bem aos sexos. Com quatro casos, P = 1/4. Para responder à pergunta, precisamos saber como foi determinado que havia uma menina na família. Se fosse possível aprender sobre um menino na família por esse método, a resposta é 2P = 1/2, não P / (1-P) = 1/3. É um pouco mais complicado se você considerar o nome Florida, ou "nascido na terça-feira", mas os resultados são os mesmos. A resposta é exatamente 1/2, se houver uma opção, e a maioria das declarações do problema implica essa opção. E o motivo de "mudar" de 1/3 para 13/27, ou de 1/3 para "quase 1/2", parece paradoxal e pouco intuitivo, porque o pressuposto de que não há escolha não é intuitivo.

No Princípio da Escolha Restrita, diga que está faltando algum conjunto de cartas equivalentes - como Valete, Dama e Rei do mesmo naipe. As chances começam mesmo que uma carta em particular pertença a um oponente específico. Mas depois que um oponente joga um, suas chances de ter qualquer um dos outros diminuem porque ele poderia ter jogado essa carta se a tivesse.

— JeffJo
fonte

P_{G} = P_{S}

$P_G=P_S$

P^{2}

$P^2$

2 P

$2P$

(1 - P)^{2}

$(1-P)^2$

1 - 2 P

$1-2P$

P_{G} = P_{S} = .8

$P_G=P_S=.8$

P_{G S} = 1.6

$P_{GS}=1.6$

P_{- G - S} = - .6

$P_{-G-S}=-.6$

P = .5

$P=.5$

Desculpe, talvez eu não tenha explicado tudo bem, tentando ser o mais breve possível. Meu P não era a probabilidade de uma caixa ter a cor ouro, era a probabilidade de ser apenas ouro. A probabilidade de ter a cor ouro é 1-P. E embora as duas propriedades sejam simétricas, elas não precisam ser independentes, portanto você não pode simplesmente multiplicar probabilidades. Além disso, nenhuma caixa é "nem". Bertrand usou três caixas com duas moedas em cada: ouro + ouro, ouro + prata e prata + prata. Uma caixa com qualquer número de moedas de ouro é "ouro" na minha generalização.

— precisa saber é o seguinte

+1, isso ajuda. Agora vejo a frase "pelo menos um de dois" e a palavra "apenas", que devo ter passado por cima.

— gung

6

$[0,1]$ $x,y\in [0,1]$ $P(x=y)=0$ $x$ $y>x$ $y<x$ $y>x$ $0.5$

— Ittay Weiss
fonte

2

[0, 1]

$[0,1]$

y

$y$

x

$x$

2

Encontro uma ilustração gráfica simplificada da falácia ecológica (aqui o paradoxo da votação Estado rico / Estado pobre) me ajuda a entender em um nível intuitivo por que vemos uma inversão dos padrões de votação quando agregamos populações do Estado:

insira a descrição da imagem aqui

— RobertF
fonte

3

Este é um bom exemplo, mas acho que esse é o Paradoxo de Simpson: en.wikipedia.org/wiki/Simpson%27s_paradox

— Nick

11

@ Nick: este exemplo em particular é realmente distinto do Paradox de Simpson, mas pode ser difícil saber qual falácia / paradoxo se aplica a uma situação específica porque eles parecem estatisticamente iguais. A diferença é que o SP é um "efeito falso" que aparece apenas ao analisar subgrupos. Essa tendência mostrada é, no entanto, um "efeito verdadeiro" que aparece apenas ao analisar subgrupos. Nesse caso, sugere que, embora a renda como número bruto não afete os padrões de votação em conjunto, a renda relacionada aos vizinhos (seu estado) influencia os padrões de votação.

— Jonathan

É a falácia ecológica, discutida abaixo.

— Charlie

3

@Charlie 'below' e 'above' são funções da maneira que um leitor da página está classificando (ativo / mais antigo / votos) e, em qualquer caso, a ordem sob alguns dos critérios de classificação pode mudar ao longo do tempo (incluindo o padrão) . Como tal, provavelmente é melhor mencionar a pessoa que postou a discussão a que você se refere, ou até o link para ela.

— Glen_b

2

Suponha que você tenha obtido dados sobre nascimentos na família real de algum reino. Na árvore genealógica cada nascimento foi anotado. O que é peculiar nessa família é que os pais estavam tentando ter um bebê apenas assim que o primeiro filho nasceu e depois não tiveram mais filhos.

Portanto, seus dados são potencialmente semelhantes a este:

G G B
B
G G B
G B
G G G G G G G G G B
etc.

A proporção de meninos e meninas nesta amostra refletirá a probabilidade geral de dar à luz um menino (por exemplo, 0,5)? A resposta e a explicação podem ser encontradas neste tópico .

— Tim
fonte

2

Essa resposta parece um quebra-cabeça, não como um paradoxo. Eu posso imaginar por que você quis publicá-lo assim, mas acho que, para que essa resposta se qualifique como paradoxo e se encaixe nesse segmento, você precisa ser mais explícito.

— ameba

2

Esta pergunta (com meninos e meninas trocados) foi feita em stats.stackexchange.com/questions/93830 , que recebeu um grande número de respostas - não totalmente de acordo! (Aprendi algo levando o problema a sério e pensando sobre ele de maneiras cada vez mais realistas, explorando as premissas necessárias para fazer isso.)

— whuber

@whuber obrigado pelo link! Eu adicionei na descrição.

— Tim

2

Este é o Paradox de Simpson novamente, mas 'para trás' e para frente, vem do novo livro de Judea Pearl, Causal Inference in Statistics: A primer [^ 1]

O clássico Paradox do Simpon funciona da seguinte maneira: considere tentar escolher entre dois médicos. Você escolhe automaticamente aquele com os melhores resultados. Mas suponha que aquele com os melhores resultados escolha os casos mais fáceis. O histórico mais pobre do outro é uma consequência de um trabalho mais complicado.

Agora quem você escolhe? Melhor olhar para os resultados estratificados por dificuldade e depois decidir.

Há um outro lado da moeda (outro paradoxo) que diz que os resultados estratificados também podem levar você à escolha errada.

Desta vez, considere optar por usar um medicamento ou não. A droga tem um efeito colateral tóxico, mas seu mecanismo terapêutico de ação é através da redução da pressão arterial. No geral, o medicamento melhora os resultados na população, mas, ao estratificar a pressão arterial pós-tratamento , os resultados são piores nos grupos de pressão arterial baixa e alta. Como pode isto ser verdade? Porque estratificamos involuntariamente o resultado e, em cada resultado, tudo o que resta a observar é o efeito colateral tóxico.

Para esclarecer, imagine que a droga seja projetada para consertar corações partidos, e isso é feito diminuindo a pressão sanguínea e, em vez de estratificar a pressão sanguínea, estratificamos os corações fixos. Quando o medicamento funciona, o coração fica fixo (e a pressão sanguínea fica mais baixa), mas alguns pacientes também recebem o efeito colateral tóxico. Como o medicamento funciona, o grupo 'coração fixo' terá mais pacientes que tomaram o medicamento do que os pacientes que tomaram o medicamento no grupo 'coração partido'. Mais pacientes que tomam o medicamento significa mais pacientes recebendo efeitos colaterais e, aparentemente (mas falsamente) melhores resultados para os pacientes que não tomaram o medicamento.

Os pacientes que melhoram sem tomar o medicamento têm apenas sorte. Os pacientes que tomaram a droga e melhoraram são uma mistura daqueles que precisavam da droga para melhorar e aqueles que teriam tido sorte de qualquer maneira. Examinar apenas pacientes com 'coração fixo' significa excluir pacientes que teriam sido corrigidos se tivessem tomado o medicamento. Excluir esses pacientes significa excluir o dano de não tomar o medicamento, o que, por sua vez, significa que só vemos o dano de tomar o medicamento.

O paradoxo de Simpson surge quando há uma causa para o resultado que não seja o tratamento, como o fato de que seu médico só faz casos complicados. Controlar a causa comum (casos complicados versus casos fáceis) nos permite ver o verdadeiro efeito. No último exemplo, estratificamos acidentalmente um resultado e não uma causa, o que significa que a resposta verdadeira está no agregado e não nos dados estratificados.

[^ 1]: Pearl J. Inferência Causal em Estatística. John Wiley & Sons; 2016

— drstevok
fonte

2

Um dos meus "favoritos", o que significa que é o que me deixa louco pela interpretação de muitos estudos (e muitas vezes pelos próprios autores, não apenas pela mídia) é o viés de sobrevivência .

Uma maneira de imaginar isso é supondo que haja algum efeito que seja muito prejudicial para os sujeitos, tanto que tenha uma chance muito boa de matá-los. Se os sujeitos forem expostos a esse efeito antes do estudo , quando o estudo começar, os sujeitos expostos que ainda estão vivos têm uma probabilidade muito alta de serem incomumente resistentes. Literalmente seleção natural no trabalho. Quando isso acontece, o estudo vai observar que os indivíduos expostos são extraordinariamente saudável (uma vez que todas as prejudiciais já morreram ou fez questão de deixar de ser exposta ao efeito) .Esta é muitas vezes mal interpretado como implicando que a exposição é realmente bom para os sujeitos. Isso é resultado da ignorância do truncamento (isto é, ignorando os sujeitos que morreram e não compareceram ao estudo).

Da mesma forma, os indivíduos que deixam de ser expostos ao efeito durante o estudo geralmente são incrivelmente prejudiciais à saúde: isso porque eles perceberam que a exposição contínua provavelmente os mataria. Mas o estudo apenas observa que aqueles que desistem são muito prejudiciais!

A resposta de Charlie sobre os bombardeiros da Segunda Guerra Mundial pode ser considerada um exemplo disso, mas também há muitos exemplos modernos. Um exemplo recente são os estudos que relatam que beber mais de 8 xícaras de café por dia(!!) está associado a uma saúde cardíaca muito maior em indivíduos com mais de 55 anos de idade. Muitas pessoas com PhD interpretaram isso como "tomar café faz bem ao seu coração!", Incluindo os autores do estudo. Eu li isso porque você precisa ter um coração incrivelmente saudável para continuar bebendo 8 xícaras de café por dia após os 55 anos de idade e não ter um ataque cardíaco. Mesmo que isso não o mate, no momento em que algo parecer preocupante com sua saúde, todo mundo que te ama (mais o seu médico) imediatamente o incentivará a parar de tomar café. Estudos posteriores descobriram que beber tanto café não teve efeitos benéficos em grupos mais jovens, o que acredito ser mais uma evidência de que estamos vendo um efeito de sobrevivência, em vez de um efeito causal positivo. No entanto, há muitos doutores correndo por aí dizendo "

— Cliff AB
fonte

Não tenho tanta certeza da sua interpretação. Na Noruega, beber 8 xícaras de café por dia não é incomum, o valor médio (incluindo crianças e outros que não bebem álcool) é de cerca de duas xícaras por dia. Na Finlândia, a média é de cerca de 2,5 xícaras por dia. Eu costumava beber mais de dez xícaras por dia, mas não mais.

— Kjetil b Halvorsen

1

Estou surpreso que ninguém tenha mencionado o Paradox de Newcombe ainda, embora seja mais discutido na teoria da decisão. É definitivamente um dos meus favoritos.

— ely
fonte

-2

Seja x, ye z sejam vetores não correlacionados. No entanto, x / z e y / z serão correlacionados.

— zbicyclist
fonte

2

Por que isso é um paradoxo? parece intuitivo.

— Lcrmorin

2

Eu ficaria surpreso se esse não fosse o caso.

— Glen_b

11

x / z

$x/z$

x / z

$x/z$

z

$z$

X, Y,

$X,Y,$

Z

$Z$