Perguntas com a marcação «prior»

Nas estatísticas bayesianas, uma distribuição prévia formaliza informações ou conhecimentos (geralmente subjetivos), disponíveis antes que uma amostra seja vista, na forma de uma distribuição de probabilidade. Uma distribuição com propagação grande é usada quando pouco se sabe sobre o (s) parâmetro (s), enquanto uma distribuição anterior mais estreita representa um maior grau de informação.


3
Como um prévio inadequado pode levar a uma distribuição posterior adequada?
Sabemos que, no caso de uma distribuição prévia adequada, P(θ∣X)=P(X∣θ)P(θ)P(X)P(θ∣X)=P(X∣θ)P(θ)P(X)P(\theta \mid X) = \dfrac{P(X \mid \theta)P(\theta)}{P(X)} ∝P(X∣θ)P(θ)∝P(X∣θ)P(θ) \propto P(X \mid \theta)P(\theta) . A justificativa usual para esta etapa é que a distribuição marginal de , é constante em relação a e, portanto, pode ser ignorada ao derivar a distribuição posterior.XXXP(X)P(X)P(X)θθ\theta …



2
Interpretação natural para hiperparâmetros LDA
Alguém pode explicar qual é a interpretação natural para os hiperparâmetros LDA? ALPHAe BETAsão parâmetros de distribuições Dirichlet para distribuições de tópicos (por documento) e (por tópico) palavras, respectivamente. No entanto, alguém pode explicar o que significa escolher valores maiores desses hiperparâmetros versus valores menores? Isso significa colocar alguma crença …

2
Por que um anterior à variância é considerado fraco?
fundo Um dos pontos fracos mais comumente usados ​​antes da variância é a gama inversa com os parâmetros (Gelman 2006) .α = 0,001 , β= 0,001α=0.001,β=0.001\alpha =0.001, \beta=0.001 No entanto, essa distribuição possui um IC de 90% de aproximadamente .[ 3 × 1019, ∞ ][3×1019,∞][3\times10^{19},\infty] library(pscl) sapply(c(0.05, 0.95), function(x) qigamma(x, …




1
Existe uma interpretação bayesiana de regressão linear com regularização simultânea de L1 e L2 (também conhecida como rede elástica)?
É sabido que a regressão linear com uma penalidade de é equivalente a encontrar a estimativa de MAP dada uma Gaussiana antes dos coeficientes. Da mesma forma, usar uma penalidade de é equivalente a usar uma distribuição de Laplace como a anterior.eu2eu2l^2eu1eu1l^1 Não é incomum usar alguma combinação ponderada de …



2
Frequentismo e Priores
Robby McKilliam diz em um comentário a este post: Deve-se ressaltar que, do ponto de vista dos freqüentadores, não há razão para que você não possa incorporar o conhecimento prévio ao modelo. Nesse sentido, a visão frequentista é mais simples, você só tem um modelo e alguns dados. Não há …


2
Que distribuições anteriores poderiam / deveriam ser usadas para a variação em um modelo bayesisan hierárquico quando a variação média é de interesse?
Em seu artigo amplamente citado, distribuições anteriores para parâmetros de variância em modelos hierárquicos (916 citação até agora no Google Scholar) Gelman propõe que boas distribuições prévias não informativas para a variação em um modelo bayesiano hierárquico são a distribuição uniforme e a distribuição de meia tonelada. Se eu entendi …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.