Somos freqüentistas realmente apenas bayesianos implícitos / inconscientes?


15

Para um dado problema de inferência, sabemos que uma abordagem bayesiana geralmente difere na forma e nos resultados de uma abordagem fequentista. Os freqüentistas (geralmente me incluem) frequentemente apontam que seus métodos não requerem um prévio e, portanto, são mais "orientados a dados" do que "orientados a julgamento". Obviamente, os bayesianos podem apontar para priors não informativos ou, sendo pragmáticos, apenas usar um prior realmente difuso.

Minha preocupação, especialmente depois de sentir uma pitada de presunção diante da minha objetividade feminista, é que talvez meus métodos "objetivos" possam ser formulados em uma estrutura bayesiana, embora com algum modelo de dados e dados incomuns. Nesse caso, sou simplesmente felizmente ignorante do absurdo prior e modelo que meu método freqüentador implica ?

Se um bayesiano apontasse tal formulação, acho que minha primeira reação seria dizer "Bem, que bom que você pode fazer isso, mas não é assim que penso sobre o problema!". No entanto, quem se importa com o que penso ou como o formulo. Se meu procedimento é estatisticamente / matematicamente equivalente a algum modelo bayesiano, estou implicitamente ( sem querer !) Realizando inferência bayesiana.

Pergunta real abaixo

Essa percepção minou substancialmente qualquer tentação de ser presunçoso. No entanto, não tenho certeza se é verdade que o paradigma bayesiano pode acomodar todos os procedimentos freqüentistas (novamente, desde que o bayesiano escolha um prior e uma probabilidade adequados) . Eu sei que o inverso é falso.

Pergunto isso porque postei recentemente uma pergunta sobre inferência condicional, o que me levou ao seguinte artigo: aqui (ver 3.9.5,3.9.6)

Eles apontam o conhecido resultado de Basu de que pode haver mais de uma estatística auxiliar, levantando a questão de qual "subconjunto relevante" é mais relevante. Pior ainda, eles mostram dois exemplos de onde, mesmo se você tiver uma estatística auxiliar exclusiva, ela não elimina a presença de outros subconjuntos relevantes.

Eles concluem que apenas métodos bayesianos (ou métodos equivalentes a eles) podem evitar esse problema, permitindo inferência condicional sem problemas.


Pode não ser o caso que Bayesian Estatísticas Fequentist Stats - que é a minha pergunta para este grupo aqui. Mas parece que uma escolha fundamental entre os dois paradigmas reside menos na filosofia do que nos objetivos: você precisa de alta precisão condicional ou baixo erro incondicional :

  • A alta precisão condicional parece aplicável quando temos que analisar uma instância singular - queremos estar certos para ESTA inferência específica, apesar do fato de que esse método pode não ser apropriado ou preciso para o próximo conjunto de dados (hipercondicionalidade / especialização).

  • Um erro incondicional baixo é apropriado quando, se estamos dispostos a fazer inferências condicionais incorretas em alguns casos, desde que nosso erro de longo prazo seja minimizado ou controlado. Honestamente, depois de escrever isso, não sei por que eu iria querer isso, a menos que estivesse sem tempo e não pudesse fazer uma análise bayesiana ... hmmm.

Eu tendem a favorecer a inferência fequentista baseada em probabilidade, desde que recebo alguma condicionalidade (assintótica / aproximada) da função de probabilidade, mas não preciso mexer em uma prévia - no entanto, me sinto cada vez mais confortável com a inferência bayesiana, especialmente se Vejo o termo aa de regularização anterior para inferência de amostra pequena.

Desculpe pelo aparte. Qualquer ajuda para o meu principal problema é apreciada.


11
uma edição da postagem parece ter atrapalhado o link, mas não há informações suficientes para corrigi-lo.
Dikran Marsupial

@DikranMarsupial obrigado por perceber isso. Eu adicionei de volta no link.

Respostas:


3

Eu argumentaria que os freqüentadores são de fato frequentemente "bayesianos implícitos / inconscientes", pois na prática geralmente queremos executar um raciocínio probabilístico sobre coisas que não têm uma frequência de longo prazo. O exemplo clássico é o Teste Estatístico de Hipótese Nula (NHST), onde o que realmente queremos saber são as probabilidades relativas das hipóteses nula e de pesquisa serem verdadeiras, mas não podemos fazer isso em um ambiente freqüentista, pois a verdade de uma hipótese específica não (não trivial) frequência de longo prazo - é verdadeira ou não. Os NHSTs freqüentistas resolvem isso substituindo uma pergunta diferente: "qual é a probabilidade de observar um resultado pelo menos tão extremo sob a hipótese nula" e depois compará-lo a um limite pré-determinado. No entanto, este procedimento não logicamente permitem concluir qualquer coisa sobre se H0 ou H1 é verdadeiro e, ao fazê-lo, estamos saindo de uma estrutura freqüentista para uma (geralmente subjetiva) bayesiana, onde concluímos que a probabilidade de observar um valor tão extremo sob H0 é tão baixo, que não podemos mais acreditar que H0 provavelmente seja verdadeiro (observe que isso está atribuindo implicitamente uma probabilidade a uma hipótese específica).

Observe que não é verdade que os procedimentos frequentistas não têm subjectividade ou antecedentes, em NHSTs o limiar no valor de p, , serve tanto a mesma finalidade que o priors p ( H 0 ) e p ( H 1 ) em uma análise bayesiana. Isso é ilustrado pelo muito discutido desenho animado do XKCD:αp(H0)p(H1)

insira a descrição da imagem aqui

α

Indiscutivelmente, intervalos de confiança são freqüentemente usados ​​(e interpretados como) um intervalo no qual podemos esperar ver as observações com uma dada probabilidade, que novamente é uma interpretação bayesiana.

Idealmente, os estatísticos devem estar cientes dos benefícios e desvantagens de ambas as abordagens e estar preparados para usar a estrutura certa para a aplicação em questão. Basicamente, devemos ter o objetivo de usar a análise que fornece a resposta mais direta à pergunta que realmente queremos ser respondida (e não substituir silenciosamente uma diferente), para que uma abordagem freqüentista seja provavelmente a mais eficiente em que realmente estamos interessados ​​em frequências de longo prazo e Métodos bayesianos onde esse não é o caso.

H0 0


2
p<0.05

3
Eu acho que funciona como uma crítica às estatísticas de "ritual nulo", onde os NHSTs são usados ​​como receita do livro de estatísticas, sem pensar / entender o procedimento (provavelmente me incluindo quando comecei; o).
Dikran Marsupial

2
Penso que um grande problema com o NHST é menos o p <0,05 ritualizado e mais do que restringe artificialmente o espaço das hipóteses. Quero dizer, eles não estão considerando (como hipóteses) as inúmeras outras razões pelas quais estaria escuro além de "o sol explodiu". Isto é o que eu realmente não gosto no NHST ... é tão conservador em relação ao nulo. Além disso, eu me pergunto qual seria o poder desse teste?

11
H0

@DikranMarsupial concorda! Fisher imaginou que eles ajudariam em experimentos agrícolas, e é daí que o valor p veio. Avaliar pesticidas e fertilizantes não é nada como avaliar questões existenciais não replicáveis ​​... ferramenta errada para o trabalho.

4

Bayesianos e freqüentistas não diferem apenas em como obtêm inferências, ou em quão semelhantes ou diferentes essas inferências podem ser incertas sobre certas escolhas anteriores. A principal diferença é como eles interpretam a probabilidade:

Probabilidade bayesiana :

A probabilidade bayesiana é uma interpretação do conceito de probabilidade. Em contraste com a interpretação da probabilidade como frequência ou propensão a algum fenômeno, a probabilidade bayesiana é uma quantidade atribuída para representar um estado de conhecimento ou um estado de crença.

Probabilidade freqüentista :

Probabilidade ou freqüentismo freqüentista é uma interpretação padrão de probabilidade; define a probabilidade de um evento como o limite de sua frequência relativa em um grande número de tentativas. Essa interpretação suporta as necessidades estatísticas de cientistas e pesquisadores de opinião; as probabilidades podem ser encontradas (em princípio) por um processo objetivo repetível (e, portanto, são idealmente desprovidas de opinião). Não suporta todas as necessidades; os jogadores normalmente exigem estimativas das probabilidades sem experimentos.

Essas duas definições representam duas abordagens irreconciliáveis ​​para definir o conceito de probabilidade (pelo menos até o momento). Portanto, existem diferenças mais fundamentais entre essas duas áreas do que se você pode obter estimadores semelhantes ou mesmas conclusões em alguns modelos paramétricos ou não paramétricos.


11
Não acho que sejam completamente inconciliáveis, uma frequência de longo prazo é uma base perfeitamente razoável para um estado de conhecimento ou crença.
Dikran Marsupial

@DikranMarsupial Este é realmente um problema aberto na filosofia da ciência. Entendo o seu ponto, mas a reconciliação não é tão direta.
Pollo Anabolico

functionally

certamente freqüentista seria funcionalmente equivalente se houvesse também um análogo freqüentista para todo procedimento bayesiano, o que não pode ser verdade, pois os bayesianos podem falar de probabilidades para coisas sem frequências de longo prazo, mas os freqüentadores não.
Dikran Marsupial

@DikranMarsupial sim, foi por isso que perguntei se o fequentist é um subconjunto de bayesiano (eu reconheci que o inverso é falso).
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.