Inferência bayesiana em uma soma de variáveis ​​aleatórias com valor real de iid


8

Seja , , ..., como seus RVs com intervalo mas com distribuição desconhecida. (Aceito que a distribuição seja contínua etc., se necessário.)X1X2Xn[0,1]

Defina .Sn=X1++Xn

Eu sou dado , e perguntar: O que posso inferir, de uma maneira Bayesian, sobre ?SkSn

Ou seja, recebi a soma de uma amostra do tamanho dos VRs e gostaria de saber o que posso deduzir sobre a distribuição da soma de todos os RVs, usando uma abordagem bayesiana (e assumindo-se anteriores razoáveis ​​sobre o distribuição).k

Se o suporte fosse vez de , esse problema será bem estudado e (com anteriores uniformes) você obterá distribuições de compostos beta-binomiais para a distribuição inferida em . Mas não sei como abordá-lo com como o intervalo ...{0,1}[0,1]Sn[0,1]

Divulgação completa : Eu já postei isso no MathOverflow , mas me disseram que seria melhor postado aqui, então isso é uma re-publicação.


Eu estava prestes a escrever um comentário para você no MO, mas vou escrevê-lo aqui. Se você acha que a pergunta é mais adequada para este fórum, você pode sinalizá-la no MO e pedir que ela seja fechada.
cardeal

1
Gostaria de esclarecer sua última declaração. Se o intervalo for , qualquer distribuição que coloque massa em valores que não estejam em para a distribuição de parecerá uma bobagem, então, me pergunto se eu ' entendi seu objetivo corretamente. (Talvez uma referência seria útil.){0,1}{0,1,,n}Sk
cardeal

O que eu entendi errado?
cardeal

1
Você está interessado em não paramétricos bayesianos? Se você não quiser fazer suposições sobre a distribuição dos 's, precisará de uma estrutura não paramétrica. Mas, em seguida, dada apenas você não pode dizer muito ...XkSk
Xi'an

1
Essas são boas observações; desculpe o problema estar um pouco confuso. Eu estava pensando que n é muito grande em comparação com , e que o posterior em refletiria diretamente o posterior nos parâmetros. Talvez, em vez de eu devesse ter usado e solicitado o posterior on medida que vai para o infinito. Isso faz sentido agora? kSnSnSn=Sn/nlimSnn
Ronald L Rivest

Respostas:


2

Considere a seguinte análise não paramétrica bayesiana.

Defina e deixe que sejam os subconjuntos Borel de . Seja uma medida finita diferente de zero .X=[0,1]BXα(X,B)

Seja um processo de Dirichlet com o parâmetro e suponha que sejam condicionais iid, dado que , de modo que , para cada .QαX1,,XnQ=qμX1(B)=P{X1B}=q(B)BB

A partir das propriedades do processo Dirichlet, sabemos que, considerando , a distribuição preditiva de uma observação futura como é a medida over definido por X1,,XkXk+1β(X,B)

β(B)=1α(X)+k(α(B)+i=1kIB(Xi)).

Agora, defina como o campo sigma gerado por e use a mensurabilidade e a simetria dos para obter quase certamente.FkX1,,XkXi

E[SnFk]=Sk+E[i=k+1nXi|Fk]=Sk+(nk)E[Xk+1Fk],

Para encontrar uma resposta explícita, suponha que seja . Definindo , temos quase com certeza (a distribuição conjunta de ), onde . No limite "não informativo" de , a expectativa anterior se reduz a , o que significa que, nesse caso, sua suposição posterior para é apenas vezes a média do primeiroα()/α(X)U[0,1]c=α(X)>0

E[SnX1=x1,,Xk=xk]=sk+nkc+k(c2+sk),
[μX1,,Xk]X1,,Xksk=x1++xkc0n(sk/k)Snnk observações, que parecem tão intuitivas quanto possível.

Também é possível obter uma boa expressão para nesse modelo? Var[Sn|Sk]
Cyan

1

Perdoe a teoria da falta de medida e os abusos de notação nos itens abaixo ...

Como essa é a inferência bayesiana, deve haver um pouco do desconhecido no problema, que neste caso é a distribuição de , um parâmetro de dimensão infinita que assume valores no conjunto de distribuições em (chame-o ). A distribuição de dados converge para uma distribuição normal; portanto, se for grande o suficiente ( teorema de Berry-Esseen ), podemos apenas dar um tapa nesse normal como uma aproximação. Além disso, se a aproximação for precisa, o único aspecto do que importa em termos práticos é o induzido antes em .X1[0,1]πSk|πkp(π)(Eπ(X1),Varπ(X1))=(μ,σ2)

Agora fazemos a previsão bayesiana padrão e colocamos as densidades aproximadas. ( está sujeito à mesma aproximação que .)SnSk

p(Sn|Sk)=p(π|Sk)p(Sn|π,Sk)dπ

p(Sn|Sk)=p(π)p(Sk|π)p(Sk)p(Sn|π,Sk)dπ

p(Sn|Sk)p(μ,σ2)N(Sk|kμ,kσ2)N(Sn|(nk)μ+Sk,(nk)σ2)d(μ,σ2)p(μ,σ2)N(Sk|kμ,kσ2)d(μ,σ2)

Para os limites da integral, , obviamente; Eu acho que ?μ[0,1]σ2[0,14]

Adicionado mais tarde: não,Isso é legal - os valores permitidos de dependem de , portanto as informações nos dados sobre são relevantes para .σ2[0,μ(1μ)].σ2μμσ2


1
Eu não entendo o seu parágrafo principal. Em primeiro lugar, a convergência para um normal é somente após uma mudança e nova escala de e isso não é pelo teorema de Berry - Esseen (que é um teorema da taxa de convergência para o normal), mas pelo CLT. Além disso, a mudança e a nova escala dependerão do parâmetro fixo específico. Você já viu um caso em que você tem, digamos, três pontos antes distribuídos uniformemente em ? Sn{0,1/2,1}
cardeal

Deixe-me esclarecer que quando escrevo "normal" não quero dizer normal normal. Portanto, a mudança e a reescala alteram a média e a variação, mas a convergência ainda está em algum elemento da família de distribuições normais. Eu quis dizer que o link para o teorema de Berry-Esseen faça referência à frase "se for grande o suficiente"; seu posicionamento atual é um erro de cortar e colar, e eu vou alterá-lo. Não entendi sua pergunta sobre o parâmetro fixo - você pode esclarecer a questão? k
Cyan

Re: pergunta do cardeal. Observe que o prior é uma distribuição em distribuições com suporte em . Se eu entendi sua pergunta literalmente, você está perguntando sobre um prior que tem suporte em três variáveis ​​aleatórias constantes , o que é trivial para analisar. Mas como você escreveu em outro comentário "Se o intervalo for , qualquer distribuição que coloque massa em valores que não estão em[0,1]0,10,1,,n para a distribuição de SkParece bobagem," Eu acho que você está pedindo distribuições de dados discretos A resposta curta é, 'não, não é bobagem' Continuação ....
Cyan


Eu acho que existem várias questões aqui: (a) A declaração da pergunta pode usar algum refinamento para esclarecer o objetivo final, (b) a pergunta, os comentários e as respostas foram, infelizmente, confusos devido a erros de digitação inadvertidos, erros de cálculo e vários tópicos de conversa , e (c) meus comentários mencionados acima parecem um pouco fora de contexto. Minha declaração sobreSk (Erro de digitação: deveria ter sido Sn) diz respeito à distribuição posterior deSn dado Sk. Se eu soubesseSn{Sk,,n}então qualquer distribuição posterior que não coloque toda a sua massa deve ser inadmissível.
cardeal

0

Deixe cada Xi pertencer à família de distribuição F e tem parâmetros θ.

Dado, Sk, temos uma distribuição em θ:

Pr(θSk)=1ZPr(θ)Pr(Skθ)

E nossa distribuição em Sn, nk é

Pr(Sn=iSk)=Pr(Snk=iSk|Sk)=Pr(Snk=iSk|θ)Pr(θSk)dθ

(e da mesma forma para n<k)

Ambas as equações têm boas formas quando Fé uma distribuição na família exponencial que é fechada sob a soma de elementos iid, como a distribuição normal, a distribuição gama e a distribuição binomial. Também funciona para seus casos especiais, como a distribuição exponencial e a distribuição de Bernoulli.

Pode ser interessante considerar F é a família de escalado (por 1n) distribuições binomiais com "ensaios" conhecidos ne tomando o limite como n vai para o infinito.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.