Para um dado número constante (por exemplo, 4), é possível encontrar uma distribuição de probabilidade para , de modo que tenhamos ?
Para um dado número constante (por exemplo, 4), é possível encontrar uma distribuição de probabilidade para , de modo que tenhamos ?
Respostas:
Considerando cuidadosamente os casos para : se , a distribuição é degenerada, mas pode ter alguma média. Ou seja, e \ Pr (X = c) = 0 para qualquer c \ neq \ mu . Portanto, podemos encontrar muitas distribuições possíveis para o X , mas elas são indexadas e completamente especificadas por \ mu \ in \ mathbb {R} .
Se , nenhuma distribuição poderá ser encontrada, pois .V a r ( X ) = E ( X - μ X ) 2 ≥ 0
Para , a resposta vai depender do que informações adicionais se sabe sobre . Por exemplo, se é conhecida por ter médios , seguida por quaisquer e podemos encontrar uma distribuição com estes momentos, tomando . Esta não é uma solução única para o problema de combinar média e variância, mas é a única solução normalmente distribuída (e de todas as soluções possíveis, é a que maximiza a entropia, como Daniel aponta). Se você também quisesse corresponder, por exemplo, ao terceiro momento central , ou superior, seria necessário considerar uma gama mais ampla de distribuições de probabilidade.X X μ μ ∈ R r > 0 X ~ N ( μ , r )
Suponhamos que tivéssemos algumas informações sobre a distribuição de vez de seus momentos. Por exemplo, se soubermos que segue uma distribuição Poisson, a solução única seria . Se sabemos que segue uma distribuição exponencial, novamente existe uma solução exclusiva , onde encontramos o parâmetro resolvendo .X X ~ P o i s s o n ( r ) X X ~ E x p o n e n t i a l ( 1Var(X)=r=1
Em outros casos, podemos encontrar uma família inteira de soluções. Se sabemos que segue uma distribuição retangular (uniforme uniforme), podemos encontrar uma largura única para a distribuição resolvendo . Mas haverá toda uma família de soluções, parametrizadas por - as distribuições neste conjunto são todas traduções de uma para a outra. Da mesma forma, se é normal, qualquer distribuição funcionaria (portanto, temos todo um conjunto de soluções indexadas por , que novamente pode ser qualquer número real e, novamente, a família é toda tradução de cada um). E sew V a r ( X ) = r = w 2 X∼U(a,a+w)a∈RXX∼N(μ,r)μXX∼Gamma(r segue uma distribuição gama; em seguida, usando a parametrização da escala de formas, podemos obter toda uma família de soluções, parametrizada por . Os membros desta família não são traduções um do outro. Para ajudar a visualizar como uma "família de soluções" pode parecer, aqui estão alguns exemplos de distribuições normais indexadas por e depois distribuições gama indexadas por , todas com variação igual a quatro, correspondendo ao exemplo em sua pergunta.θ>0μθr=4
Por outro lado, para algumas distribuições, pode ou não ser possível encontrar uma solução, dependendo do valor de . Por exemplo, se deve ser uma variável de Bernoulli, então para existem duas soluções possíveis porque existem duas probabilidades que resolvem a equação , e de fato essas duas probabilidades são complementares, isto é, . Para existe apenas a solução única , e para distribuição de Bernoulli não apresenta variação suficientemente alta.X 0 ≤ r < 0,25 X ~ B e r n o u l l i ( p ) p V um r ( X ) = r = p ( 1 - P ) p 1 + p 2 = 1 r = 0,25 p = 0,5 r > 0,25
Acho que também devo mencionar o caso . Também existem soluções para este caso, por exemplo, uma distribuição de Student com dois graus de liberdade.t
Código R para parcelas
require(ggplot2)
x.df <- data.frame(x = rep(seq(from=-8, to=8, length=100), times=5),
mu = rep(c(-4, -2, 0, 2, 4), each=100))
x.df$pdf <- dnorm(mean=x.df$mu, x.df$x)
ggplot(x.df, aes(x=x, y=pdf, group=factor(mu), colour=factor(mu))) + theme_bw() +
geom_line(size=1) + scale_colour_brewer(name=expression(mu), palette="Set1") +
theme(legend.key = element_blank()) + ggtitle("Normal distributions with variance 4")
x.df <- data.frame(x = rep(seq(from=0, to=20, length=1000), times=5),
theta = rep(c(0.25, 0.5, 1, 2, 4), each=1000))
x.df$pdf <- dgamma(x.df$x, shape=4/(x.df$theta)^2, scale=x.df$theta)
ggplot(x.df, aes(x=x, y=pdf, group=factor(theta), colour=factor(theta))) + theme_bw() +
geom_line(size=1) + scale_colour_brewer(name=expression(theta), palette="Set1") +
theme(legend.key = element_blank()) + ggtitle("Gamma distributions with variance 4") +
coord_cartesian(ylim = c(0, 1))
Supondo que você queira dizer "é possível encontrar uma distribuição de probabilidade para ", a resposta é sim, pois você não especificou nenhum critério que deva satisfazer. De fato, há um número infinito de distribuições possíveis que satisfariam essa condição. Apenas considere uma distribuição Normal, . Você pode definir e pode assumir qualquer valor que você gosta - você terá, então, , conforme necessário.X N ( x ; μ , σ 2 ) σ 2 = r μ V a r [ X ] = r
De fato, a distribuição Normal é bastante especial nesse sentido, pois é a distribuição de probabilidade máxima de entropia para uma determinada média e variância.
Essa questão pode ser interpretada de uma maneira que a torne interessante e não inteiramente trivial. Dado algo que se parece com uma variável aleatória, até que ponto é possível atribuir probabilidades a seus valores (ou mudar as probabilidades existentes) de tal maneira que sua variação seja igual a algum número pré-especificado ? A resposta é que todos os valores possíveis são permitidas, até um limite determinado pela gama de .r r ≥ 0 X
O interesse potencial em uma análise desse tipo reside na idéia de alterar uma medida de probabilidade, mantendo uma variável aleatória fixa, a fim de alcançar um fim específico. Embora essa aplicação seja simples, ela exibe algumas das idéias subjacentes ao teorema de Girsanov , um resultado fundamental nas finanças matemáticas.
Vamos reafirmar esta questão de maneira rigorosa e inequívoca. Suponha
é uma função mensurável definida em um espaço de medida com sigma-algebra . Para um determinado número real , quando é possível encontrar uma medida de probabilidade neste espaço para o qual ?S r > 0 P Var ( X ) = r
Acredito que a resposta é que isso é possível quando . Xsup(X)=∞inf(X)=-∞r (A igualdade pode valer se o supremo e o mínimo forem ambos alcançados: ou seja, eles realmente são o máximo e o mínimo de ) Quando ou , essa condição não impõe limite em e, em seguida, todos os valores não negativos da variação são possíveis.
A prova é por construção. Vamos começar com uma versão simples, para cuidar dos detalhes e definir a idéia básica, e depois prosseguir para a construção real.
Seja na imagem de : isso significa que existe um para o qual . Defina a função definida para ser o indicador de : ou seja, se e quando .X ω x ∈ ohms X ( ω x ) = x P : S → [ 0 , 1 ] ω x P ( A ) = 0 ω x ∉ Um P ( A ) = 1 ω x ∈ Um
Como , obviamente satisfaz os dois primeiros axiomas de probabilidade . É necessário mostrar que satisfaz o terceiro; ou seja, que é aditivo ao sigma. Mas isso é quase tão óbvio: sempre que é um conjunto finito ou infinitamente contável de eventos mutuamente exclusivos, então nenhum deles contém - nesse caso para todos os - ou exatamente um deles contém ; nesse caso, para um determinado e, caso contrário, para todos osP { E i , i = 1 , 2 , … } ω x P ( E i ) = 0 i ω x P ( E j ) = 1 j P ( E i ) = 0 i ≠ j. Em ambos os casos
porque ambos os lados são ou ambos .1
Desde concentra toda a probabilidade em , a distribuição de é concentrada em e devem ter zero variância.ω x X x X
Seja dois valores no intervalo de ; isto é, e . De maneira semelhante à etapa anterior, defina uma medida como uma média ponderada dos indicadores de e . Usar pesos não-negativos e para a ser determinado. Assim como antes, descobrimos que sendo uma combinação convexa das medidas indicadoras discutidas em (1) - é uma medida de probabilidade. A distribuição de em relação a esta medida é uma Bernoulli X X ( ω 1 ) = x 1 X ( ω 2 ) = x 2 P ω 1 - p p p P X ( p ) x 2 - x 1 - x 1 ( p ) p ( 1 - p ) X ( x 2 - x 1distribuição que foi dimensionada por e deslocada por . Como a variação de uma distribuição de Bernoulli é , a variação de deve ser .
Uma conseqüência imediata de (2) é que qualquer para o qual exista no intervalo de e para o qualx 1 ≤ x 2 X 0 ≤ p < 1
pode ser a variância de . Como , isso implica0 ≤ p ( 1 - P ) ≤ 1 / 4
com igualdade mantendo se e somente se tiver um máximo e um mínimo.
Por outro lado, se exceder esse limite de , nenhuma solução será possível, pois já sabemos que a variação de qualquer variável aleatória limitada não pode exceder um quarto da quadrado do seu alcance.( sup ( X ) - inf ( X ) ) 2 / 4
Sim, é possível encontrar essa distribuição. De fato, você pode obter qualquer distribuição com uma variação finita e escalar para corresponder à sua condição, porque
Por exemplo, uma distribuição uniforme no intervalo tem variação: σ 2 = 1 Portanto, uma distribuição uniforme no intervalo[0,1
De fato, essa é uma maneira comum de adicionar parâmetros a algumas distribuições, como o Student t. Possui apenas um parâmetro, - graus de liberdade. Quando ν → ∞ a distribuição converge para um padrão normal. É em forma de sino e parece muito com o normal, mas tem caudas mais gordas. É por isso que é frequentemente usado como uma alternativa a uma distribuição normal quando as caudas são gordas. O único problema é que a distribuição gaussiana tem dois parâmetros. Então, vem a versão em escala do Student t, que às vezes é chamada de distribuição " t location scale" . Essa é uma transformação muito simples: ξ = t - μ , ondeμ,ssão localização e escala. Agora, você pode definir a escala para que a nova variávelξtenha qualquer variação necessária e tenha uma forma de distribuição t de Student.