Qual é a diferença entre DP e CRP?
O processo de restaurante chinês (CRP) é uma distribuição sobre partições de números inteiros . A conexão com o Processo Dirichlet (DP) existe graças ao teorema de De Finetti.
Teorema de de finetti: Suponhamos que temos um processo aleatório que é infinitamente permutável , então a probabilidade conjunta tem uma representação de como uma mistura de:p ( θ 1 , … , θ N )( θ1, … , ΘN)p ( θ1, … , ΘN)
p ( θ1, … , ΘN) = ∫dP( G ) ∏i = 1NG ( θEu)
para alguns variável aleatória .G
A propriedade permutabilidade significa que não nos importamos com os índices das tabelas (não nomeamos as tabelas) e não nos importamos com a ordem dos clientes em uma tabela específica. A partição de clientes em conjuntos diferentes é a única estrutura em que estamos interessados. Isso significa que, dada uma partição , não precisamos conhecer as atribuições específicas de clientes para as tabelas, precisamos apenas conhecer o número de clientes em cada tabela.
Teorema de de finetti não ajuda em encontrar a distribuição . Ele afirma apenas que deveria existir.G
O processo Dirichlet é uma prévia das distribuições . Informalmente, você lança uma distribuição de probabilidade e, quando faz uma amostragem, obtém uma distribuição de probabilidade após a distribuição de probabilidade.
A conexão entre ambos pode ser estabelecida provando que, se é amostrado a partir de um processo de Dirichlet, a equação no teorema de De Finetti vale para esse particular .GGG
E se
G ∼ D P( α , H)
então
p ( { θ( z= 0 )0 0, … , Θ( z= 0 )n0 0} , … , { Θ( z= k )0 0, … , Θ( z= k )nk} ) = αkΓ ( α )Γ ( α + n )∏i = 0kΓ ( nEu)
Observe que é descrito por um CRP através de probabilidades para partições específicas. Aqui indica um índice de tabela . E é o número de clientes na tabela . Para completar, lembre-se de que o é:p ( θ1, … , ΘN)z= iEunEuEuD P
{ G ( A1) , … , G ( Ak) } ~ D i r i c h l e t ( α H( A1) , … , Α H( Ak) ))
Eu acho que é claro nesta exposição que a conexão está lá, mas não deve ser considerada trivial. Observe também que não descrevi o CRP no sentido de uma distribuição condicional entre os clientes individuais entrantes. Isso adicionaria mais um passo conceitual entre o CRP e o DP. Meu conselho: sinta-se à vontade para não se sentir à vontade em entender diretamente o relacionamento deles e comece a brincar com a descrição das distribuições conjuntas e marginais até reproduzir a conexão. A PCR é obtida marginalizando do DP.G
Para a conexão entre a probabilidade conjunta e a descrição seqüencial do CRP, consulte [1].
E se a permutabilidade não for válida?
Se a permutabilidade não se mantiver, não falamos mais sobre o PD ou o CRP, mas sobre o Processo de Dirichlet Dependente e o Processo de Restaurante Chinês Dependente. E, naturalmente, a conexão entre eles se perde!
Veja [2] para detalhes. O CRP dependente descreve qual cliente deseja se sentar com qual (único) outro cliente. Ao agrupar todas as relações cliente-cliente, podemos fazer uma atribuição sobre tabelas. O CRP dependente não é marginalmente invariável: a probabilidade de uma partição ao remover um cliente também depende desse mesmo cliente. Pelo contrário, o DP dependente é frequentemente definido por este mesmo marginal: . Aqui é, por exemplo, uma distribuição de Dirichlet em si ou qualquer distribuição que faça com que e sejam relacionados.Gt~ D P( α , H)HGtGt′
Existem muitas outras generalizações possíveis, algumas delas admitem uma representação tanto de partições quanto de distribuições, como o processo de restaurante chinês com dois parâmetros no processo de Pitman-Yor ou o processo de buffet indiano no processo beta [3] . Alguns deles não.
- [1] : Um tutorial sobre modelos não paramétricos bayesianos (2011) Gershman e Blei
- [2] : Processos de restaurantes chineses dependentes da distância (2011) Blei e Frazier
- [3] : Processos beta hierárquicos e processo de buffet indiano (2007) Thibaux e Jordan