Minhas perguntas reais estão nos dois últimos parágrafos, mas para motivá-las:
Se estou tentando estimar a média de uma variável aleatória que segue uma distribuição Normal com uma variação conhecida, li que colocar um uniforme antes da média resulta em uma distribuição posterior proporcional à função de probabilidade. Nessas situações, o intervalo Bayesiano credível se sobrepõe perfeitamente ao intervalo de confiança freqüentista, e a estimativa bayesiana máxima a posteriori é igual à estimativa freqüencial máxima de verossimilhança.
Em uma configuração de regressão linear simples,
colocar um uniforme anterior em e um inverso gama antes de com pequenos valores de parâmetro resulta em um posterior que será muito semelhante ao freqüentador e um intervalo credível para a distribuição posterior de que será muito semelhante ao intervalo de confiança em torno da estimativa de probabilidade máxima. Eles não serão exatamente os mesmos porque o anterior em exerce uma pequena quantidade de influência e se a estimativa posterior for realizada por simulação do MCMC, que introduzirá outra fonte de discrepância, mas o intervalo Bayesiano em torno doσ 2 β H A P β M G E β | X σ 2 β H A P β M G Ee o intervalo de confiança freqüentista em torno de estará bem próximo um do outro e, é claro, à medida que o tamanho da amostra aumenta, eles devem convergir à medida que a influência da probabilidade cresce para dominar a do anterior.
Mas eu li que também existem situações de regressão em que essas equivalências quase não são válidas. Por exemplo, regressões hierárquicas com efeitos aleatórios ou regressão logística - essas são situações em que, no meu entender, não existem objetivos ou referências de referência "bons".
Portanto, minha pergunta geral é esta - supondo que eu queira fazer inferência sobree que eu não tenho informações prévias que quero incorporar, por que não posso prosseguir com a estimativa de verossimilhança de probabilidade freqüente nessas situações e interpretar as estimativas de coeficiente resultantes e os erros padrão como as estimativas Bayesianas do MAP e os desvios-padrão e tratá-los implicitamente estimativas "posteriores" como resultantes de um prior que deve ter sido "não informativo" sem tentar encontrar a formulação explícita do prior que levaria a esse posterior? Em geral, dentro do campo da análise de regressão, quando é correto proceder nesse sentido (de tratar a probabilidade como posterior) e quando não é correto? E os métodos freqüentistas que não são baseados em probabilidade, como métodos de quase-probabilidade,
As respostas dependem de se meu objetivo de inferência são estimativas pontuais de coeficientes, ou a probabilidade de um coeficiente estar dentro de um intervalo específico ou quantidades da distribuição preditiva?