Suponha que tenhamos um conjunto de pontos . Cada ponto é gerado usando a distribuição Para obter posterior para , escrevemos p (x | \ mathbf {y}) \ propto p (\ mathbf {y} | x) p (x) = p (x) \ prod_ {i = 1} ^ N p (y_i x) De acordo com o artigo de Minka na expectativa de propagação precisamos 2 ^ N cálculos para se obter posterior p (x | \ mathbf {y}) e, assim, torna-se intratável problema para a grande amostra tamanhos N . No entanto, não consigo descobrir por que precisamos dessa quantidade de cálculos nesse caso, porque, para um único y_i
Usando esta fórmula, obtemos posterior pela multiplicação simples de , portanto, precisamos apenas de operações e, portanto, podemos resolver esse problema exatamente para tamanhos grandes de amostra.
Faço experimentos numéricos para comparar se realmente obtenho o mesmo posterior no caso de calcular cada termo separadamente e no caso de usar produto de densidades para cada . Os posteriores são os mesmos. Veja onde estou errado? Alguém pode me esclarecer por que precisamos de operações para calcular posteriormente o dado e a amostra ?2 N x y