Podemos pensar em uma probabilidade no sentido clássico e subjetivo simultaneamente?

Sou estudante de estatística. Estou tentando entender as definições clássicas e objetivas de probabilidade e como elas estão relacionadas à inferência freqüentista e bayesiana. Não é óbvio para mim por que a probabilidade clássica é combinada com a inferência freqüentista e por que a inferência bayesiana é combinada com a probabilidade subjetiva. Em algumas fontes, li declarações como as seguintes deste artigo de Wellek (desculpe, não encontrei uma versão que não estivesse atrás de um muro de pagamento):

Do ponto de vista freqüentista, os parâmetros populacionais são constantes não observáveis sobre as quais nenhuma declaração de probabilidade significativa pode ser feita.

Estou tentando entender se isso se deve à definição clássica de probabilidade como ensaios repetidos ou se se deve às restrições da inferência freqüentista.

Minhas perguntas específicas estão no final, se os leitores preferem pular adiante, mas eu queria compartilhar meus pensamentos, caso isso ajude.

Considere a variável aleatória . Sob a definição clássica de probabilidade, se eu quisesse medir cientificamente empiricamente a probabilidade de que , acho que só preciso repetir o experimento várias vezes e fazer uma contagem. Pela definição subjetiva, acho que devo consultar inicialmente minhas próprias crenças ou as crenças de um agente racional. À medida que coleto mais dados, essas crenças são modificadas racionalmente. $X$ $P(X=x)$

Agora parece-me que não pode ser observado; portanto, não há como calcular o valor de pelo meu procedimento empírico clássico. Por outro lado, sempre posso acreditar em coisas que não consigo observar diretamente como e, portanto, assumindo que conheço alguma relação entre coisas que posso observar como e coisas que não consigo observar como , isso me permite ter crenças sobre que eu posso modificar racionalmente ao longo do tempo. $H_0|X$ $P(H_0|X)$ $H_0|X$ $X$ $H_0$ $P(H_0|X)$

Ocorre-me que também posso argumentar que, para o frequentista, é uma propriedade fixa do universo, de qualquer maneira, talvez eu esteja preso à noção de que é fixo, mesmo que eu pudesse observá-lo. Mas e se pensarmos no experimento típico de jogar uma moeda e modificá-la para dizer que tenho uma grande quantidade de moedas e sempre uso uma nova sempre que gravo um flip? Portanto, nesse caso, suspeito que exista um parâmetro subjacente que seja específico da moeda, mas nunca posso observá-lo diretamente. Portanto, é significativo, mas não posso computá-lo via observação direta de . $H_0$ $H_0$ $p$ $P(p=0.5|X)$ $p$

Então, apenas para retornar às minhas perguntas de alto nível.

Existe alguma maneira significativa de interpretar um procedimento de inferência bayesiana como um freqüentista?
Existe alguma maneira significativa de fazer inferência bayesiana onde as probabilidades são definidas de acordo com a definição clássica de probabilidade?

— Kareem Carr
fonte

O documento está disponível no sci-hub. Também: +1

— Alexis

"Na visão bayesiana, ... os dados são corrigidos" me surpreendeu. Acredito que os bayesianos adotam o ponto de vista estatístico quase universal de que os dados são analisados usando um modelo de probabilidade para eles. Portanto, seus modelos consistem em distribuições conjuntas de parâmetros e dados. Na medida em que suas perguntas se baseiem nesse entendimento, você poderá reformulá-las.

— whuber

@whuber Okay. Ótimo. Obrigado por esclarecer esse mal-entendido. Vou incorporá-lo à minha pergunta (supondo que exista uma versão da minha pergunta que ainda faça sentido).

— Kareem Carr

Algo relacionado: stats.stackexchange.com/a/232507/28666

— ameba

Para o comentário de @whuber, a modelagem bayesiana requer um modelo para que os dados tenham uma função de probabilidade. Mas então os dados são totalmente condicionados e tratados como um monte de constantes com o objetivo de obter as distribuições dos parâmetros desconhecidos.

— Frank Harrell

Há uma pergunta muito semelhante anterior em: A probabilidade é fundamentalmente sobre classes de referência (reais ou imaginárias)? e eu realmente estou tentando aqui responder a ambos. Devemos começar com o que é probabilidade?

A resposta matemática é que o que preenche os axiomas de probabilidade usuais é uma probabilidade. Mas isso realmente não responde à nossa pergunta! porque estamos em como podemos usar a probabilidade , como podemos interpretar a probabilidade . No meu pensamento (hoje, 7 de março de 2018, amanhã ...), todas as concepções de probabilidade (freqüentista, subjetiva, pessoal, ...) têm uma coisa importante em comum, que lhes dá um significado comum. Esse é o conceito de calibração ou classes de referência . Para calibração, consulte, por exemplo, Visualização da calibração da probabilidade prevista de um modelo ou pesquise neste site por "calibração". Para classes de referência, a primeira postagem vinculada.

A calibração difere em que tipo de classes de referência você está calibrando:

Para probabilidade freqüentista clássica, estamos nos calibrando contra um conjunto bem definido de eventos empiricamente observáveis e similares, como repetições de arremessos da mesma moeda ou dado. Diz-se que essas probabilidades são objetivas porque a maioria das pessoas razoáveis concorda com elas.
Os apostadores precisam calibrar contra seu grupo de apostadores, para que, a longo prazo, suas vitórias e perdas sejam equilibradas. Se seu grupo de apostadores, como coletivo, estiver mal calibrado no sentido de 1), o apostador deve se ajustar a isso. Outra maneira de dizer isso é que as chances dos apostadores (ou probabilidades) são realmente preços de mercado.
A probabilidade subjetiva é formada pela pessoa que faz o julgamento formando classes de equivalência de eventos com resultado incerto. Eventos $A,B$ estão na mesma classe de equivalência se essa pessoa as julgar permutáveis. Isso significa que, para essa pessoa, em qualquer sistema de apostas envolvendo $A$ mas não $B$ ele pode trocar $A$ para $B$ e ainda avaliar a aposta pelo mesmo preço. Tais eventos devem ter a mesma probabilidade. Portanto, as classes de equivalência consistem em eventos considerados com a mesma probabilidade e a calibração é contra a frequência de eventos de longo prazo na classe.

Poderíamos dizer que a probabilidade tem uma face de Janus:

(ou talvez seja melhor dizer que a probabilidade é um troll de muitas cabeças!)

Com esse ponto de vista, parece que há um continuum de interpretações, de muito objetivo a muito subjetivo! mais do que discretas interpretações diferentes. Muitas discussões práticas sobre probabilidade podem ser enquadradas dentro desses conceitos, um exemplo: qual é a probabilidade de uma explosão no Mar do Norte? Pouco antes da explosão do Bravo no campo Ekofisk https://en.wikipedia.org/wiki/Ekofisk_oil_fieldIsso foi discutido no Storting, um membro perguntou o que havia sido feito sobre o risco de explosão e mencionou probabilidades retiradas da experiência histórica do golfo do México. O ministro do petróleo Bjartmar Gjerde respondeu que isso o lembrava a mulher que tinha três filhos e não queria mais, porque ouvira dizer que cada quarto filho nascido era chinês ... No dia seguinte à explosão, o jornal dagbladet tinha o seguinte título: "Um chinês nasce no mar do Norte". Portanto, a experiência do Golfo do México deve ser usada na formação de classes de referência para o Mar do Norte, ou formuladas de outra forma, as explosões no Golfo do México e no Mar do Norte devem ser calibradas juntas ou separadamente? Não há uma resposta completamente objetiva a essas perguntas, tornando essas avaliações parcialmente subjetivas, mesmo que visemos interpretações de frequência.

Portanto, "subjetividade" em "probabilidade subjetiva" significa que pessoas razoáveis diferentes podem chegar a diferentes avaliações, definir classes de referência de maneiras diferentes, não que "tudo corra". Para que a probabilidade subjetiva seja significativa, espera-se que as classes de referência (ou procedimento de calibração) sejam feitas o mais explícitas possível, para que a discussão e a crítica sejam possíveis. Caso contrário, ele apenas degenerará em um jogo de adivinhação de números.

Portanto, nesse sentido, a probabilidade (subjetiva) é significativa apenas para eventos cuja probabilidade pode ser calibrada. Um exemplo em que isso não é possível (acredito) é $\DeclareMathOperator{\P}{\mathbb{P}}\P(\text{Does God exist})$ . A calibração é impossível, portanto, essa probabilidade não pode ser significativa. Nesse sentido, podemos falar sobre probabilidade (subjetiva) de evento $E$ somente se a ocorrência ou não de $E$ acabará por ser conhecido, ou pelo menos o que é possível, pelo menos em princípio.

Então, para sua primeira pergunta:

Do ponto de vista freqüentista, os parâmetros populacionais são constantes não observáveis sobre as quais nenhuma declaração de probabilidade significativa pode ser feita.

Bem, o frequentista escolhe não fazer nenhuma declaração de probabilidade sobre o valor do parâmetro desconhecido (mas fixo), mas ele é forçado a fazer essa escolha? Agora ele não é. Como exemplo, deixe o parâmetro $\mu$ representam a altura média de homens noruegueses de 20 anos. Como não sabemos o valor exato, faz sentido fazer apostas em eventos (proposições) envolvendo $mu$ digamos $E=\{ \mu <= 1.73\text{m}\}$ . Mas acima dissemos que "... podemos falar sobre probabilidade (subjetiva) de evento $E$ somente se a ocorrência ou não de $E$ acabará por ser conhecido, ... ". É esse o caso de $E$ ? Não como formulado, mas bayesianos como DeFinetti refletiram profundamente sobre esse problema e apresentaram a seguinte resolução. Deixei $X=(X_1, X_2, \dotsc, X_n, \dotsc)$ observação da altura em uma amostra aleatória de 20 anos de machos noruegueses. Antes de coletar a amostra, teremos algumas expectativas sobre os possíveis valores. Sendo uma amostra aleatória, a distribuição de $X$ será intercambiável . deFinetti provou seu teorema da representação, um (infinitamente) trocável $X$ pode ser representado como condicionalmente independente, dada uma variável latente subjacente, no exemplo $\mu$ (e talvez alguns outros parâmetros como $\sigma$ ) e com uma distribuição prévia dessas variáveis / parâmetros latentes. Dessa maneira, podemos construir uma distribuição de probabilidade (anterior) em $\mu$ , e ainda pense nisso como uma constante desconhecida! Isso pode parecer estranho, mas pode ser resolvido pensando nessa distribuição como epistêmica , não aleatória . Desta forma, a aposta em $\mu$ pode ser traduzido para uma aposta em $X$ , que podemos resolver.

(ainda não terminou, mas já é tarde da noite ...) Espero que ajude, estou realmente escrevendo isso para esclarecer minhas idéias para mim ... Há muito trabalho a fazer para tornar essa configuração matematicamente rigorosa, embora eu espero que isso possa ser feito. Se alguém tiver algumas referências relevantes interessantes, por favor, ...

— kjetil b halvorsen
fonte

Eu acho que um dos melhores pensamentos sobre isso está no livro de IJ Good, Good Thinking, onde ele tem um argumento convincente de que todas as probabilidades são subjetivas, devido ao que está na mente / base de conhecimento do observador. Se apenas um jogador soubesse que uma carta tinha uma superfície áspera, esse jogador teria uma probabilidade diferente dessa carta subir ao topo do baralho do que os outros jogadores. (Esse foi um dos exemplos de Good) #

— Frank Harrell #