Respostas:
Não é um paradoxo em si , mas é um comentário intrigante, pelo menos a princípio.
Durante a Segunda Guerra Mundial, Abraham Wald foi estatístico do governo dos EUA. Ele olhou para os bombardeiros que retornavam das missões e analisou o padrão das balas "feridas" nos aviões. Ele recomendou que a Marinha reforçasse áreas onde os aviões não apresentavam danos.
Por quê? Temos efeitos de seleção no trabalho. Esta amostra sugere que os danos infligidos nas áreas observadas poderiam ser resistidos. Os aviões nunca foram atingidos nas áreas intocadas, uma proposição improvável ou os ataques a essas partes foram letais. Preocupamo-nos com os aviões que caíram, não apenas com os que retornaram. Aqueles que caíram provavelmente sofreram um ataque em um local que não foi tocado pelos que sobreviveram.
Para cópias de seus memorandos originais, veja aqui . Para uma aplicação mais moderna, consulte esta postagem no blog da Scientific American .
Expandindo um tema, de acordo com este post do blog , durante a Primeira Guerra Mundial, a introdução de um capacete de estanho levou a mais ferimentos na cabeça do que um chapéu de pano comum. O novo capacete foi pior para os soldados? Não; embora as lesões fossem maiores, as mortes eram menores.
Outro exemplo é a falácia ecológica .
Exemplo
Suponha que procuremos uma relação entre votação e renda regredindo a parcela de votos do então senador Obama sobre a renda mediana de um estado (em milhares). Temos um intercepto de aproximadamente 20 e um coeficiente de inclinação de 0,61.
Muitos interpretariam esse resultado como dizendo que pessoas com renda mais alta têm maior probabilidade de votar nos democratas; de fato, os livros de imprensa populares fizeram esse argumento.
Mas espere, pensei que era mais provável que os ricos fossem republicanos? Eles são.
O que essa regressão está realmente nos dizendo é que os estados ricos têm mais probabilidade de votar em um democrata e os estados pobres têm mais probabilidade de votar em um republicano. Dentro de um determinado estado , as pessoas ricas têm mais chances de votar nos republicanos e as pobres têm mais chances de votar nos democratas. Veja o trabalho de Andrew Gelman e seus co-autores .
Sem outras suposições, não podemos usar dados em nível de grupo (agregados) para fazer inferências sobre o comportamento em nível individual. Essa é a falácia ecológica. Os dados no nível do grupo podem nos informar apenas sobre o comportamento no nível do grupo.
Para dar um salto para inferências em nível individual, precisamos da suposição de constância . Aqui, a escolha do voto dos indivíduos não varia sistematicamente com a renda mediana de um estado; uma pessoa que ganha $ X em um estado rico deve ter a mesma probabilidade de votar em um democrata do que alguém que ganha $ X em um estado pobre. Mas as pessoas em Connecticut, em todos os níveis de renda, são mais propensas a votar em um democrata do que as pessoas no Mississippi nesses mesmos níveis de renda . Portanto, a suposição de consistência é violada e somos levados à conclusão errada (enganados pelo viés de agregação ).
Este tópico era um cavalo-marinho frequente do falecido David Freedman ; veja este documento , por exemplo. Nesse artigo, Freedman fornece um meio para limitar probabilidades em nível individual usando dados de grupo.
Comparação com o paradoxo de Simpson
Em outra parte desta CW, @Michelle propõe o paradoxo de Simpson como um bom exemplo, como realmente é. O paradoxo de Simpson e a falácia ecológica estão intimamente relacionados, mas são distintos. Os dois exemplos diferem na natureza dos dados fornecidos e nas análises utilizadas.
A formulação padrão do paradoxo de Simpson é uma tabela de mão dupla. Em nosso exemplo aqui, suponha que tenhamos dados individuais e classifiquemos cada indivíduo como alta ou baixa renda. Obteríamos uma tabela de contingência 2x2 de renda por voto dos totais. Veríamos que uma parcela maior de pessoas de alta renda votava no democrata em relação à parcela de pessoas de baixa renda. Se criarmos uma tabela de contingência para cada estado, no entanto, veremos o padrão oposto.
Na falácia ecológica, não colapsamos a renda em uma variável dicotômica (ou talvez multicotômica). Para chegar ao nível estadual, obtemos a participação média (ou mediana) da renda e do voto do estado e fazemos uma regressão e descobrimos que os estados de maior renda têm maior probabilidade de votar no democrata. Se mantivéssemos os dados no nível individual e executássemos a regressão separadamente por estado, encontraríamos o efeito oposto.
Em resumo, as diferenças são:
Observação geral O
@NeilG comenta que isso parece estar dizendo que você não pode ter nenhuma seleção sobre problemas de viés de variáveis não observáveis / omitidas em sua regressão. Está certo! Pelo menos no contexto da regressão, acho que quase qualquer "paradoxo" é apenas um caso especial de viés de variáveis omitidas.
O viés de seleção (veja minha outra resposta neste CW) pode ser controlado incluindo as variáveis que conduzem a seleção. Obviamente, essas variáveis normalmente não são observadas, direcionando o problema / paradoxo. A regressão espúria (minha outra outra resposta) pode ser superada adicionando uma tendência temporal. Esses casos dizem, essencialmente, que você tem dados suficientes, mas precisa de mais preditores.
No caso da falácia ecológica, é verdade, você precisa de mais preditores (aqui, inclinações e interceptações específicas do estado). Mas você precisa de mais observações, individuais, e não de grupo, para estimar esses relacionamentos.
(Aliás, se você tiver uma seleção extrema em que a variável de seleção divida perfeitamente tratamento e controle, como no exemplo da Segunda Guerra Mundial que eu dou, você pode precisar de mais dados para estimar a regressão também; aí, os planos abatidos.)
Minha contribuição é o paradoxo de Simpson porque:
pode ser muito difícil explicar por que as descobertas são do jeito que são para leigos em inglês comum.
Versão do paradoxo: a significância estatística de um resultado parece diferir dependendo de como os dados são particionados. A causa geralmente parece dever-se a uma variável confusa.
Outro bom esboço do paradoxo está aqui .
Não há paradoxos nas estatísticas, apenas quebra-cabeças aguardando solução.
No entanto, o meu favorito é o "envelope" de dois envelopes . Suponha que eu coloque dois envelopes na sua frente e diga que um contém o dobro do dinheiro que o outro (mas não qual é qual). Você raciocina da seguinte maneira. Suponha que o envelope esquerdo contenha , e com 50% de probabilidade, o envelope direito contenha e com 50% de probabilidade contenha , para um valor esperado de . Mas é claro que você pode simplesmente inverter os envelopes e concluir que o envelope esquerdo contém vezes o valor do envelope certo. O que aconteceu?2 x 0,5 x 1,25 x 1,25
O Problema da Bela Adormecida .
Esta é uma invenção recente; foi bastante discutido em um pequeno conjunto de revistas de filosofia na última década. Existem defensores firmes de duas respostas muito diferentes (os "Halfers" e "Thirders"). Isso levanta questões sobre a natureza da crença, probabilidade e condicionamento e fez com que as pessoas invocassem uma interpretação da mecânica quântica de "muitos mundos" (entre outras coisas bizarras).
Aqui está a declaração da Wikipedia:
A Bela Adormecida se oferece para se submeter à experiência a seguir e recebe todos os detalhes a seguir. No domingo, ela é colocada para dormir. Uma moeda justa é então lançada para determinar qual procedimento experimental é realizado. Se a moeda aparecer, Beauty será despertada e entrevistada na segunda-feira e o experimento será encerrado. Se a moeda aparecer, ela é despertada e entrevistada na segunda e terça-feira. Mas quando ela é colocada para dormir novamente na segunda-feira, ela recebe uma dose de um medicamento indutor de amnésia que garante que ela não se lembra do seu despertar anterior. Nesse caso, o experimento termina depois que ela é entrevistada na terça-feira.
Sempre que a Bela Adormecida é despertada e entrevistada, ela é questionada: "Qual é a sua credibilidade agora para a proposição de que a moeda caiu cara?"
A posição Thirder é que SB deve responder "1/3" (este é um cálculo simples do Teorema de Bayes) e a posição Halfer é que ela deve dizer "1/2" (porque essa é a probabilidade correta de uma moeda justa, obviamente! ) IMHO, todo o debate repousa sobre uma compreensão limitada da probabilidade, mas não é esse o objetivo de explorar aparentes paradoxos?
(Ilustração do Projeto Gutenberg .)
Embora este não seja o lugar para tentar resolver paradoxos - apenas para indicá-los -, não quero deixar as pessoas presas e tenho certeza de que a maioria dos leitores desta página não deseja examinar as explicações filosóficas. Podemos dar uma dica de ET Jaynes , que substitui a pergunta “como podemos construir um modelo matemático do senso comum humano” - que é algo de que precisamos para pensar no problema da Bela Adormecida - por “Como podemos construir uma máquina que executaria um raciocínio plausível útil, seguindo princípios claramente definidos que expressam um senso comum idealizado? ”Assim, se você preferir, substitua SB pelo robô pensante de Jaynes. Você pode clonareste robô (em vez de administrar uma droga amnésica fantástica) para a parte terça-feira do experimento, criando assim um modelo claro da configuração do SB que pode ser analisada sem ambiguidade. Modelar isso de maneira padrão, usando a teoria da decisão estatística, revela que realmente há duas perguntas sendo feitas aqui ( qual é a chance de uma moeda justa cair cara? E qual é a chance de a moeda cair cara, dependendo do fato de você ser o clone que foi acordado? ). A resposta é 1/2 (no primeiro caso) ou 1/3 (no segundo, usando o Teorema de Bayes). Nenhum princípio da mecânica quântica estava envolvido nesta solução :-).
Arntzenius, Frank (2002). Reflexões sobre a Bela Adormecida . Análise 62,1 pp 53-62. Elga, Adam (2000). Crença de auto-localização e o problema da Bela Adormecida. Análise 60 pp 143-7.
Franceschi, Paul (2005). A Bela Adormecida e o Problema da Redução Mundial . Pré-impressão.
Groisman, Berry (2007). O fim do pesadelo da Bela Adormecida .
Lewis, D. (2001). A Bela Adormecida: responda a Elga . Análise 61,3 pp 171-6.
Papineau, David e Victor Dura-Vila (2008). Uma sede e um Everettiano: uma resposta à 'Quantum Sleeping Beauty' de Lewis .
Pust, Joel (2008). Horgan sobre a Bela Adormecida . Synthese 160 pp 97-101.
Vineberg, Susan (sem data, talvez 2003). Conto preventivo da beleza .
Tudo pode ser encontrado (ou pelo menos foi encontrado há vários anos) na Web.
O paradoxo de São Petersburgo , que faz você pensar de maneira diferente no conceito e significado do Valor Esperado . A intuição (principalmente para pessoas com formação em estatística) e os cálculos estão dando resultados diferentes.
O paradoxo de Jeffreys-Lindley , que mostra que, em algumas circunstâncias, os métodos freqüentistas e bayesianos padrão de teste de hipóteses podem dar respostas completamente contraditórias. Realmente força os usuários a pensar exatamente sobre o significado dessas formas de teste e a considerar se é isso que realmente querem. Para um exemplo recente, veja esta discussão .
Existe a famosa falácia de duas meninas:
Em uma família com dois filhos, quais são as chances, se um deles é menina , de os dois serem meninas?
A maioria das pessoas diz intuitivamente 1/2
, mas a resposta é 1/3
. A questão, fundamentalmente, é que escolher uniformemente "uma garota de todas as meninas com um irmão" aleatoriamente não é o mesmo que escolher uniformemente "uma família, de todas as famílias com dois filhos e pelo menos uma garota".
Essa é simples o suficiente para combinar com a intuição, depois que você a entender, mas há versões mais complicadas e mais difíceis de entender:
Em uma família com dois filhos, quais são as chances, se um deles é um menino nascido na terça-feira , de que ambos sejam meninos? (Resposta: 13/27)
Em uma família com dois filhos, quais são as chances, se um deles for uma menina chamada Florida , de que ambos sejam meninas? (Resposta: muito próximo de 1/2, assumindo que "Florida" seja um nome extremamente raro)
Mais informações sobre todos esses quebra-cabeças podem ser encontradas nesta resposta .
(Também: Mais informações sobre o menino nascido na terça-feira , mais informações sobre a garota chamada Florida )
1/3
não é 2/3
certamente? Apenas um fora deGB, BG, GG
Desculpe, mas não consigo me conter (também amo paradoxos estatísticos!).
Novamente, talvez não seja um paradoxo em si e outro exemplo de viés de variáveis omitidas.
Causa / regressão espúrias
Qualquer variável com uma tendência temporal será correlacionada com outra variável que também tenha uma tendência temporal. Por exemplo, meu peso desde o nascimento até os 27 anos será altamente correlacionado com o seu peso, desde o nascimento até os 27 anos. Obviamente, meu peso não é causado pelo seu peso. Se fosse, eu pediria que você fosse à academia com mais frequência, por favor.
Ao executar a análise de séries temporais, você precisa ter certeza de que suas variáveis estão estacionárias ou obterá esses resultados de causalidade espúrios.
(Admito plenamente que plagiei minha própria resposta dada aqui .)
Um dos meus favoritos é o problema de Monty Hall. Lembro-me de aprender sobre isso em uma aula de estatística elementar, contando ao meu pai que, quando estávamos incrédulos, simulei números aleatórios e tentamos o problema. Para nossa surpresa, era verdade.
Basicamente, o problema afirma que, se você tivesse três portas em um game show, atrás das quais uma é um prêmio e as outras duas nada, se você escolhesse uma porta e depois soubesse das duas portas restantes, uma das duas não seria uma porta de premiação e você pode mudar sua escolha, se assim desejar, deve mudar sua porta atual para a porta restante.
Aqui também está o link para uma simulação R: LINK
Paradoxo de Parrondo:
Da wikipdedia : "O paradoxo de Parrondo, um paradoxo na teoria dos jogos, foi descrito como: Uma combinação de estratégias de perda se torna uma estratégia vencedora. É nomeado após seu criador, Juan Parrondo, que descobriu o paradoxo em 1996. Uma descrição mais explicativa é :
Existem pares de jogos, cada um com uma maior probabilidade de perder do que ganhar, para os quais é possível construir uma estratégia vencedora jogando os jogos alternadamente.
Parrondo concebeu o paradoxo em conexão com sua análise da catraca browniana, um experimento mental sobre uma máquina que supostamente pode extrair energia de movimentos aleatórios de calor popularizados pelo físico Richard Feynman. No entanto, o paradoxo desaparece quando analisado rigorosamente ".
Há também um paradoxo relacionado mais recente chamado " mistura allison " , que mostra que podemos pegar duas séries de IDI e não correlacionadas e embaralhá-las aleatoriamente para que certas misturas possam criar uma série resultante com autocorrelação diferente de zero.
É interessante que o problema das duas crianças e o problema de Monty Hall sejam mencionados com frequência no contexto do paradoxo. Ambos ilustram um aparente paradoxo ilustrado pela primeira vez em 1889, chamado Box Paradox de Bertrand, que pode ser generalizado para representar qualquer um. Acho esse um "paradoxo" mais interessante, porque as mesmas pessoas muito educadas e muito inteligentes respondem a esses dois problemas de maneiras opostas em relação a esse paradoxo. Também se compara a um princípio usado em jogos de cartas como o bridge, conhecido como Princípio da Escolha Restrita, onde sua resolução é testada pelo tempo.
Digamos que você tenha um item selecionado aleatoriamente que chamarei de "caixa". Cada caixa possível possui pelo menos uma das duas propriedades simétricas, mas algumas possuem as duas. Vou chamar as propriedades de "ouro" e "prata". A probabilidade de uma caixa ser apenas ouro é P; e como as propriedades são simétricas, P também é a probabilidade de uma caixa ser apenas prata. Isso aumenta a probabilidade de que uma caixa tenha apenas uma propriedade 2P e a probabilidade de ter uma propriedade 2P.
Se lhe disserem que uma caixa é dourada, mas não se for prata, você pode ficar tentado a dizer que as chances de ser apenas ouro são P / (P + (1-2P)) = P / (1-P). Mas então você teria que declarar a mesma probabilidade para uma caixa de uma cor se lhe dissessem que era prata. E se essa probabilidade for P / (1-P) sempre que uma instrução lhe indicar uma cor, ela deverá ser P / (1-P), mesmo que você não saiba uma cor. No entanto, sabemos que é 2P do último parágrafo.
Esse aparente paradoxo é resolvido observando que, se uma caixa tiver apenas uma cor, não haverá ambiguidade sobre a cor que será informada. Mas se houver dois, há uma escolha implícita. Você precisa saber como essa escolha foi feita para responder à pergunta, e essa é a raiz do aparente paradoxo. Se não lhe disserem, você pode apenas assumir que uma cor foi escolhida aleatoriamente, tornando a resposta P / (P + (1-2P) / 2) = 2P. Se você insiste que P / (1-P) é a resposta, está implicitamente assumindo que não havia possibilidade de a outra cor ter sido mencionada, a menos que fosse a única cor.
No problema de Monty Hall, a analogia para as cores não é muito intuitiva, mas P = 1/3. As respostas baseadas nas duas portas fechadas originalmente com a mesma probabilidade de receber o prêmio estão assumindo que Monty Hall era obrigado a abrir a porta que ele abriu, mesmo que ele tivesse uma escolha. Essa resposta é P / (1-P) = 1/2. A resposta que lhe permite escolher aleatoriamente é 2P = 2/3 para a probabilidade de que a troca ganhe.
No Problema dos Dois Filhos, as cores na minha analogia se comparam muito bem aos sexos. Com quatro casos, P = 1/4. Para responder à pergunta, precisamos saber como foi determinado que havia uma menina na família. Se fosse possível aprender sobre um menino na família por esse método, a resposta é 2P = 1/2, não P / (1-P) = 1/3. É um pouco mais complicado se você considerar o nome Florida, ou "nascido na terça-feira", mas os resultados são os mesmos. A resposta é exatamente 1/2, se houver uma opção, e a maioria das declarações do problema implica essa opção. E o motivo de "mudar" de 1/3 para 13/27, ou de 1/3 para "quase 1/2", parece paradoxal e pouco intuitivo, porque o pressuposto de que não há escolha não é intuitivo.
No Princípio da Escolha Restrita, diga que está faltando algum conjunto de cartas equivalentes - como Valete, Dama e Rei do mesmo naipe. As chances começam mesmo que uma carta em particular pertença a um oponente específico. Mas depois que um oponente joga um, suas chances de ter qualquer um dos outros diminuem porque ele poderia ter jogado essa carta se a tivesse.
Encontro uma ilustração gráfica simplificada da falácia ecológica (aqui o paradoxo da votação Estado rico / Estado pobre) me ajuda a entender em um nível intuitivo por que vemos uma inversão dos padrões de votação quando agregamos populações do Estado:
Suponha que você tenha obtido dados sobre nascimentos na família real de algum reino. Na árvore genealógica cada nascimento foi anotado. O que é peculiar nessa família é que os pais estavam tentando ter um bebê apenas assim que o primeiro filho nasceu e depois não tiveram mais filhos.
Portanto, seus dados são potencialmente semelhantes a este:
G G B
B
G G B
G B
G G G G G G G G G B
etc.
A proporção de meninos e meninas nesta amostra refletirá a probabilidade geral de dar à luz um menino (por exemplo, 0,5)? A resposta e a explicação podem ser encontradas neste tópico .
Este é o Paradox de Simpson novamente, mas 'para trás' e para frente, vem do novo livro de Judea Pearl, Causal Inference in Statistics: A primer [^ 1]
O clássico Paradox do Simpon funciona da seguinte maneira: considere tentar escolher entre dois médicos. Você escolhe automaticamente aquele com os melhores resultados. Mas suponha que aquele com os melhores resultados escolha os casos mais fáceis. O histórico mais pobre do outro é uma consequência de um trabalho mais complicado.
Agora quem você escolhe? Melhor olhar para os resultados estratificados por dificuldade e depois decidir.
Há um outro lado da moeda (outro paradoxo) que diz que os resultados estratificados também podem levar você à escolha errada.
Desta vez, considere optar por usar um medicamento ou não. A droga tem um efeito colateral tóxico, mas seu mecanismo terapêutico de ação é através da redução da pressão arterial. No geral, o medicamento melhora os resultados na população, mas, ao estratificar a pressão arterial pós-tratamento , os resultados são piores nos grupos de pressão arterial baixa e alta. Como pode isto ser verdade? Porque estratificamos involuntariamente o resultado e, em cada resultado, tudo o que resta a observar é o efeito colateral tóxico.
Para esclarecer, imagine que a droga seja projetada para consertar corações partidos, e isso é feito diminuindo a pressão sanguínea e, em vez de estratificar a pressão sanguínea, estratificamos os corações fixos. Quando o medicamento funciona, o coração fica fixo (e a pressão sanguínea fica mais baixa), mas alguns pacientes também recebem o efeito colateral tóxico. Como o medicamento funciona, o grupo 'coração fixo' terá mais pacientes que tomaram o medicamento do que os pacientes que tomaram o medicamento no grupo 'coração partido'. Mais pacientes que tomam o medicamento significa mais pacientes recebendo efeitos colaterais e, aparentemente (mas falsamente) melhores resultados para os pacientes que não tomaram o medicamento.
Os pacientes que melhoram sem tomar o medicamento têm apenas sorte. Os pacientes que tomaram a droga e melhoraram são uma mistura daqueles que precisavam da droga para melhorar e aqueles que teriam tido sorte de qualquer maneira. Examinar apenas pacientes com 'coração fixo' significa excluir pacientes que teriam sido corrigidos se tivessem tomado o medicamento. Excluir esses pacientes significa excluir o dano de não tomar o medicamento, o que, por sua vez, significa que só vemos o dano de tomar o medicamento.
O paradoxo de Simpson surge quando há uma causa para o resultado que não seja o tratamento, como o fato de que seu médico só faz casos complicados. Controlar a causa comum (casos complicados versus casos fáceis) nos permite ver o verdadeiro efeito. No último exemplo, estratificamos acidentalmente um resultado e não uma causa, o que significa que a resposta verdadeira está no agregado e não nos dados estratificados.
[^ 1]: Pearl J. Inferência Causal em Estatística. John Wiley & Sons; 2016
Um dos meus "favoritos", o que significa que é o que me deixa louco pela interpretação de muitos estudos (e muitas vezes pelos próprios autores, não apenas pela mídia) é o viés de sobrevivência .
Uma maneira de imaginar isso é supondo que haja algum efeito que seja muito prejudicial para os sujeitos, tanto que tenha uma chance muito boa de matá-los. Se os sujeitos forem expostos a esse efeito antes do estudo , quando o estudo começar, os sujeitos expostos que ainda estão vivos têm uma probabilidade muito alta de serem incomumente resistentes. Literalmente seleção natural no trabalho. Quando isso acontece, o estudo vai observar que os indivíduos expostos são extraordinariamente saudável (uma vez que todas as prejudiciais já morreram ou fez questão de deixar de ser exposta ao efeito) .Esta é muitas vezes mal interpretado como implicando que a exposição é realmente bom para os sujeitos. Isso é resultado da ignorância do truncamento (isto é, ignorando os sujeitos que morreram e não compareceram ao estudo).
Da mesma forma, os indivíduos que deixam de ser expostos ao efeito durante o estudo geralmente são incrivelmente prejudiciais à saúde: isso porque eles perceberam que a exposição contínua provavelmente os mataria. Mas o estudo apenas observa que aqueles que desistem são muito prejudiciais!
A resposta de Charlie sobre os bombardeiros da Segunda Guerra Mundial pode ser considerada um exemplo disso, mas também há muitos exemplos modernos. Um exemplo recente são os estudos que relatam que beber mais de 8 xícaras de café por dia(!!) está associado a uma saúde cardíaca muito maior em indivíduos com mais de 55 anos de idade. Muitas pessoas com PhD interpretaram isso como "tomar café faz bem ao seu coração!", Incluindo os autores do estudo. Eu li isso porque você precisa ter um coração incrivelmente saudável para continuar bebendo 8 xícaras de café por dia após os 55 anos de idade e não ter um ataque cardíaco. Mesmo que isso não o mate, no momento em que algo parecer preocupante com sua saúde, todo mundo que te ama (mais o seu médico) imediatamente o incentivará a parar de tomar café. Estudos posteriores descobriram que beber tanto café não teve efeitos benéficos em grupos mais jovens, o que acredito ser mais uma evidência de que estamos vendo um efeito de sobrevivência, em vez de um efeito causal positivo. No entanto, há muitos doutores correndo por aí dizendo "
Estou surpreso que ninguém tenha mencionado o Paradox de Newcombe ainda, embora seja mais discutido na teoria da decisão. É definitivamente um dos meus favoritos.