Eu estava lendo este artigo na Nature, no qual algumas falácias são explicadas no contexto da análise de dados. Percebi que a falácia do atirador de elite do Texas era particularmente difícil de evitar:
Uma armadilha cognitiva que aguarda durante a análise dos dados é ilustrada pela fábula do atirador de elite do Texas: um atirador inepto que dispara um padrão aleatório de balas ao lado de um celeiro, desenha um alvo em torno do maior grupo de buracos de bala e aponta orgulhosamente para o sucesso dele.
Seu alvo é obviamente risível - mas a falácia não é tão óbvia para os jogadores que acreditam em uma 'mão quente' quando têm uma série de vitórias, ou para pessoas que vêem um significado sobrenatural quando um sorteio aparece como todos os números ímpares.
Nem sempre é óbvio para os pesquisadores. "Você apenas recebe algum incentivo com os dados e depois pensa: bem, esse é o caminho a seguir", diz Pashler. “Você não percebe que tinha 27 opções diferentes e escolheu a que lhe deu os resultados mais agradáveis ou interessantes, e agora está envolvido em algo que não é de modo algum uma representação imparcial dos dados. "
Eu acho que esse tipo de trabalho de exploração é comum e, muitas vezes, hipóteses são construídas com base nessa parte da análise. Existe uma abordagem completa ( EDA ) dedicada a esse processo:
A análise exploratória dos dados foi promovida por John Tukey para incentivar estatísticos a explorá-los e, possivelmente, formular hipóteses que poderiam levar a novas coletas e experimentos de dados.
Parece que qualquer processo exploratório realizado sem uma hipótese prévia é propenso a gerar hipóteses falsas.
Observe que a descrição da EDA acima realmente fala sobre new data collection and experiments
. Entendo que, após a coleta de novos dados, uma análise de dados confirmatória (CDA) é apropriada. No entanto, não acho que essa distinção seja feita com muita clareza e, embora uma separação entre EDA e CDA seja ideal, certamente há algumas circunstâncias em que isso não é viável. Eu diria que seguir essa separação estritamente é incomum e a maioria dos profissionais não subscreve o paradigma da EDA.
Portanto, minha pergunta é: a EDA (ou qualquer processo informal de exploração de dados) aumenta a probabilidade de cair na falácia do atirador de elite do Texas?