Costumo ouvir a afirmação de que as estatísticas bayesianas podem ser altamente subjetivas.
Eu também. Mas observe que há uma grande ambiguidade em chamar algo de subjetivo.
Subjetividade (ambos os sentidos)
Subjetivo pode significar (pelo menos) um dos
- depende das idiossincrasias do pesquisador
- explicitamente preocupado com o estado de conhecimento de um indivíduo
O bayesianismo é subjetivo no segundo sentido, porque oferece sempre uma maneira de atualizar crenças representadas por distribuições de probabilidade condicionando a informação. (Observe que se essas crenças são crenças que algum sujeito realmente tem ou apenas crenças que um sujeito poderia ter é irrelevante para decidir se é 'subjetiva'.)
O argumento principal é que a inferência depende da escolha de um
Na verdade, se um prior representa sua crença pessoal sobre algo, você quase certamente não a escolheu mais do que escolheu a maioria de suas crenças. E se representa as crenças de alguém, pode ser uma representação mais ou menos precisa dessas crenças; portanto, ironicamente, haverá um fato bastante "objetivo" sobre o quão bem as representa.
(mesmo que alguém possa usar o princípio da indiferença ou entropia máxima para escolher uma prévia).
Pode-se, embora isso não tenda a generalizar muito suavemente para domínios contínuos. Além disso, é possível argumentar que é impossível ser simples ou 'indiferente' em todas as parametrizações de uma só vez (embora eu nunca tenha tido certeza do por que você gostaria de ser).
Em comparação, afirma a alegação, as estatísticas freqüentistas são, em geral, mais objetivas. Quanta verdade existe nesta afirmação?
Então, como podemos avaliar essa afirmação?
Sugiro que, no segundo segundo sentido do subjetivo: é quase sempre correto. E no primeiro sentido do subjetivo: provavelmente é falso.
Frequentismo como subjetivo (segundo sentido)
Alguns detalhes históricos são úteis para mapear os problemas
Para Neyman e Pearson, existe apenas comportamento indutivo , não inferência indutiva e toda avaliação estatística funciona com propriedades de amostragem de longo prazo dos estimadores. (Daí a análise alfa e de potência, mas não os valores de p). Isso é bastante subjetivo nos dois sentidos.
De fato, é possível, e eu acho bastante razoável, argumentar sobre essas linhas que o Frequentismo não é realmente uma estrutura de inferência, mas uma coleção de critérios de avaliação para todos os procedimentos possíveis de inferência que enfatizam seu comportamento em aplicações repetidas. Exemplos simples seriam consistência, imparcialidade, etc. Isso o torna obviamente não-subjetivo no sentido 2. No entanto, também corre o risco de ser subjetivo no sentido 1 quando precisamos decidir o que fazer quando esses critérios não se aplicam (por exemplo, quando não há um estimador imparcial a ser obtido) ou quando eles se aplicam, mas contradizem.
Fisher ofereceu um freqüentismo menos subjetivo que é interessante. Para Fisher, existe uma inferência indutiva, no sentido de que um sujeito, o cientista, faz inferências com base em uma análise de dados, feita pelo estatístico. (Daí os valores p, mas não as análises alfa e de potência). No entanto, as decisões sobre como se comportar, se deve continuar com a pesquisa etc. são tomadas pelo cientista com base em sua compreensão da teoria dos domínios, e não pelo estatístico que aplica o paradigma da inferência. Por causa dessa divisão de trabalho dos pescadores, tanto a subjetividade (sentido 2) quanto a individual (sentido 1) estão do lado da ciência, não do lado estatístico.
Legalmente falando, o Frequentismo de Fisher é subjetivo. Só que o sujeito que é subjetivo não é o estatístico.
Existem várias sínteses disponíveis, tanto a mistura pouco coerente que você encontra nos livros de estatística aplicada quanto em versões mais diferenciadas, por exemplo, as 'Estatísticas de erro' apresentadas por Deborah Mayo. Este último é bastante subjetivo no sentido 2, mas altamente subjetivo no sentido 1, porque o pesquisador precisa usar o julgamento científico - estilo Fisher - para descobrir quais probabilidades de erro são importantes e devem ser testadas.
Frequentismo como subjetivo (primeiro sentido)
Então o Frequentismo é menos subjetivo no primeiro sentido? Depende. Qualquer procedimento de inferência pode ser repleto de idiossincrasias, como realmente aplicadas. Então, talvez seja mais útil perguntar se o freqüentismo incentiva uma abordagem menos subjetiva (primeiro sentido)? Duvido - acho que a aplicação consciente de métodos subjetivos (segundo sentido) leva a resultados menos subjetivos (primeiro sentido), mas pode ser argumentada de qualquer maneira.
Suponha por um momento que a subjetividade (primeiro sentido) entre na análise através de 'escolhas'. O bayesianismo parece envolver mais 'escolhas'. No caso mais simples, as escolhas contam como: um conjunto de suposições potencialmente idiossincráticas para o freqüentista (a função de verossimilhança ou equivalente) e dois conjuntos para o bayesiano (a verossimilhança e uma prévia sobre as incógnitas).
No entanto, os bayesianos sabem que estão sendo subjetivos (no segundo sentido) sobre todas essas opções, de modo que podem ser mais conscientes das implicações que devem levar a menos subjetividade (no primeiro sentido).
Por outro lado, se alguém procurar um teste em um grande livro de testes, poderá ter a sensação de que o resultado é menos subjetivo (primeiro sentido), mas sem dúvida isso é resultado da substituição do entendimento de algum outro sujeito do problema pelo próprio . Não está claro que alguém tenha se tornado menos subjetivo dessa maneira, mas pode parecer assim. Eu acho que a maioria concorda que isso é inútil.