Acabei de assistir a uma palestra sobre inferência estatística ("comparando proporções e médias"), parte de uma introdução ao curso on-line de estatísticas. O material fez tão pouco sentido para mim como sempre (agora eu já deveria ter visto esse material dezenas de vezes, espalhado nas últimas três décadas).
Estou procurando um livro sobre "Estatísticas básicas-101" (estimativa pontual, avaliação estimada, inferência estatística, teste de hipóteses, desenho de estudo) que leve a sério o problema de convencer um leitor cético ...
Abaixo, dou alguns exemplos do tipo de pergunta que o autor que estou procurando levaria a sério e saberia lidar de maneira convincente.
Mas, primeiro, permita-me salientar que neste post não estou fazendo essas perguntas. Por favor, não responda! Dou-lhes apenas exemplos, e como "teste decisivo" (para o tipo de autor de pesquisa).
Se uma "proporção" é simplesmente a média de uma variável booleana (ou seja, que aceita apenas os valores 0 e 1), por que diferentes procedimentos são ensinados para fazer inferência estatística com "proporções" e com "meios"?
Se a distribuição normal é tão robusta que, assumindo a normalidade, obtém bons resultados, mesmo nos casos em que esses dados não são normalmente distribuídos normalmente, e se a distribuição t é tão normal, por que todo o barulho de usar a distribuição t em vez de normal?
O que exatamente são "graus de liberdade" e por que nos preocupamos com eles?
O que significa falar do valor "verdadeiro" de um parâmetro, considerando que estamos apenas usando distribuições que parecem semelhantes aos dados?
Por que a "análise exploratória de dados" é uma coisa boa, enquanto a "espionagem de dados" é uma coisa má?
Como já disse, fico impressionado com a atitude implícita na negligência de tais perguntas. Não é a "postura epistemológica" que quero ver em alguém que está me ensinando alguma coisa. Procuro autores que respeitem o ceticismo e a racionalidade do leitor e que sabem como abordá-los (sem necessariamente entrar em páginas e páginas de formalismos e detalhes técnicos).
Percebo que essa é uma tarefa difícil, e talvez especialmente quando se trata de estatística. Portanto, não espero que muitos autores tenham conseguido. Mas no momento eu ficaria satisfeito em encontrar apenas um .
Deixe-me acrescentar que não sou avesso à matemática. Pelo contrário, eu amo matemática. (Estou acostumado com a análise [aka "cálculo avançado"], álgebra linear, teoria das probabilidades e até teoria básica das medidas.)
Dito isto, meu interesse no momento está nas estatísticas "aplicadas", "práticas", "cotidianas" e "do mundo real" (em oposição às sutilezas teóricas). (Mas também não quero um livro de receitas!)
FWIW, li os primeiros capítulos da análise de dados usando modelos de regressão e modelos multiníveis / hierárquicos de Gelman e Hill, e gosto do tom dos autores. Seu foco é prático, mas entre na teoria quando necessário. Eles também costumam recuar e avaliar criticamente as práticas padrão, e oferecem opiniões sinceras que apelam ao bom senso de um leitor cético. Infelizmente, esses autores não escreveram um livro dedicado ao assunto sobre o qual estou perguntando neste post (material "Estatísticas 101", como descrito acima). Também estou ciente de que um desses autores (Gelman) foi co-autor da análise de dados Bayesiana, altamente conceituada , mas, novamente, não é isso que estou procurando no momento.
EDITAR:
Dikran Marsupial levanta a seguinte objeção:
Eu não acho que exista necessariamente algo errado em negligenciar as perguntas; chega um momento em que abordar todas as questões diminui a exposição dos conceitos básicos que geralmente são mais importantes (especialmente em um livro sobre estatísticas 101).
Eu concordo com isso. Seria mais preciso dizer que estou procurando uma "segunda olhada nas estatísticas básicas". De fato, com essa motivação, observei os livros didáticos usados nos cursos de graduação em inferência (por exemplo) e descobri que eles também negligenciavam questões como as que eu listei. Na verdade, eles pareciam ainda menos inclinados a se aprofundar em tais questões (para que pudessem se concentrar em assuntos como as condições para alguma convergência ou outra disso ou daquilo ...).
O problema é que os livros mais avançados são dirigidos a uma população radicalmente diferente de leitores, onde o "ceticismo do forasteiro" foi drasticamente esgotado. IOW, aqueles que estão fazendo estatísticas no nível da pós-graduação já passaram do ponto de se incomodarem com as perguntas que me incomodam. Eles não estão mais céticos sobre nada disso. (Como eles superaram a crise de ceticismo? Talvez alguns nunca tenham sido muito críticos em primeiro lugar, especialmente se eles aprenderam suas estatísticas bem cedo - eu sei que eu não era um calouro particularmente crítico, por exemplo, embora eu não tenha faça estatísticas. Outros podem ter professores que informaram onde seus livros ficaram aquém. Alguns podem ter sido espertos o suficiente para descobrir por si próprios as respostas a essas perguntas. Quem sabe.)