Variável aleatória definida como A com 50% de chance e B com 50% de chance


8

Nota: este é um problema de lição de casa, portanto, não me dê a resposta completa!

Eu tenho duas variáveis, A e B, com distribuições normais (médias e variações são conhecidas). Suponha que C seja definido como A com 50% de chance e B com 50% de chance. Como eu iria provar se C também é normalmente distribuído e, em caso afirmativo, qual é sua média e variação?

Não sei como combinar os PDFs de A e B dessa maneira, mas, idealmente, se alguém puder me apontar na direção certa, meu plano de ataque é obter o PDF de C e mostrar se é ou não um variação do PDF normal.


2
Talvez veja a Wikipedia sobre 'distribuição de mistura'.
precisa saber é o seguinte

6
Um gráfico pode dar uma boa dica sobre se é normalmente distribuído. C
Kodiologist

4
A plotagem do PDF de alguns casos mostra rapidamente que geralmente não é Normal: ele pode ter dois modos. A parte divertida consiste em obter uma caracterização completa de quando é normalmente distribuído. CC
whuber

4
Sempre acho mais fácil trabalhar com o CDF de uma variável aleatória que o PDF.
usar o seguinte

5
E, como sugestão, considere atrair alguém aleatoriamente da população composta por todos os bebês com menos de um ano de idade e todos os jogadores da NBA. Você esperaria encontrar alguém com cerca de um metro e meio de altura?
usar o seguinte

Respostas:


8

Espero que esteja claro para você que C não é garantido que seja normal. No entanto, parte da sua pergunta era como escrever seu PDF. @BallpointBen deu uma dica. Se isso não for suficiente, aqui estão mais alguns spoilers ...

Observe que C pode ser escrito como: para um aleatório de Bernoulli com com independente de . Esta é mais ou menos a tradução matemática padrão da afirmação em inglês "C é A com 50% de chance e B com 50% de chance".

C=TA+(1T)B
TP(T=0)=P(T=1)=1/2T(A,B)

Agora, é difícil determinar o PDF de C diretamente a partir disso, mas é possível progredir anotando a função de distribuição de C. É possível particionar o evento em dois subeventos (dependendo do valor de ) para gravar :FCCXT

FC(x)=P(Cx)=P(T=0 and Cx)+P(T=1 and C x)

e observe que, pela definição de C e pela independência de T e B, você tem:

P(T=0 and Cx)=P(T=0 and Bx)=12P(Bx)=12FB(x)

Você deve poder usar um resultado semelhante no caso para escrever em termos de e . Para obter o PDF de C, apenas diferencie em relação a x.T=1FCFAFBFC


11
Notavelmente, resulta desta resposta que pode ser normal, por exemplo, quando são distribuídos de forma idêntica. C A,B
Mees de Vries

8

A simulação de uma mistura aleatória 50-50 de e é ilustrada abaixo. Simulação em R.Norm(μ=90,σ=2)Norm(μ=100,σ=2)

set.seed(827);  m = 10^6
x1 = rnorm(m, 100, 2);  x2 = rnorm(m, 90, 2)
p = rbinom(m, 1, .5)
x = x1;  x[p==1] = x2[p==1]
hist(x, prob=T, col="skyblue2", main="Random 50-50 Mixture of NORM(90,2) and NORM(100,2)")
  curve(.5*(dnorm(x, 100, 2) + dnorm(x, 90, 2)), add=T, col="red", lwd=2)

insira a descrição da imagem aqui


7

Uma maneira de trabalhar com isso é analisá-lo, pois a variação tende a 0. Dessa forma, você obteria uma distribuição do tipo Bernoulli, que (claramente) não é uma distribuição normal.


11
Eu não fiz post é como um comentário, porque eu não tenho reputação suficiente
André Costa

11
No entanto, uma boa sugestão. (+1)
BruceET 27/08/18

1

Esse é o tipo de problema em que é muito útil usar o conceito de CDF, a função cumulativa de distribuição de probabilidade, de variáveis ​​aleatórias, esse conceito totalmente desnecessário que os professores arrastam apenas para confundir os alunos que estão felizes em usar apenas pdfs.

Por definição, o valor do CDF de uma variável aleatória é igual à probabilidade de que não seja maior que o número real , ou seja, Agora, a lei da probabilidade total nos diz que se é igualmente provável que seja uma variável aleatória ou uma variável aleatória , então ou, em outras palavras, FX(α)XXα

FX(α)=P{Xα}, <α<.
XAB
P{Xα}=12P{Aα}+12P{Bα},
FX(α}=12FA(α}+12FB(α}.
Lembrando-se de como seu professor era chato de falar sobre como para variáveis ​​aleatórias contínuas o pdf é a derivada do CDF, obtemos que que responde a uma de suas perguntas.No caso especial das variáveis ​​aleatórias normais e , você pode descobrir se fornece uma densidade normal para ou não? Se você está familiarizado com as noções como você pode descobrir, substituindo o lado direito de para em
(1)fX(α}=12fA(α}+12fB(α}
AB(1)X
(2)E[X]=αfX(α}dα,
(1)fX(α)(2)e pensando na expressão, o que é em termos de e ?E[X]E[A]E[B]

1

C não é distribuído normalmente, a menos que e sejam distribuídos de forma idêntica. Se e forem distribuídos de forma idêntica, também será distribuído de forma idêntica.ABABC

Prova

Seja , e as funções de distribuição cumulativa (CDFs) de A, B e C, respectivamente, e , e suas funções de densidade de probabilidade (PDFs), ieFAFBFCfAfBfC

FA(x)=Pr(A<x),FB(x)=Pr(B<x),FC(x)=Pr(C<x),fA(x)=ddxFA(x),fB(x)=ddxFB(x), andfC(x)=ddxFC(x).

Também temos dois eventos:

  • Γ1 , que é quando é definido como , o que ocorre com probabilidadeCAγ
  • Γ2 , que é quando é definido como , que ocorre com probabilidadeCB1γ

De acordo com a lei da probabilidade total ,

FC(x)=Pr(C<x)=Pr(C<x | Γ1)Pr(Γ1)+Pr(C<x | Γ2)Pr(Γ2)=Pr(A<x)Pr(Γ1)+Pr(B<x)Pr(Γ2)=γFA(x)+(1γ)FB(x).

Portanto,

fC(x)=ddxFC(x)=ddx(γFA(x)+(1γ)FB(x))=γ(ddxFA(x))+(1γ)(ddxFB(x))=γfA(x)+(1γ)fB(x),

e comoγ=0.5,

fC(x)=0.5fA(x)+0.5fB(x).

Além disso, como o PDF de uma distribuição normal é uma função gaussiana positiva e a soma de duas funções gaussianas possíveis é uma função gaussiana positiva se e somente se as duas funções gaussianas forem linearmente dependentes, é normalmente distribuído se e somente se e são distribuídos de forma idêntica.CAB

Se e são distribuídos de forma idêntica, , então também será distribuído de forma idêntica.ABfA(x)=fB(x)=fC(x)C


2
Esse é um bom ponto, mas você não acha que ajudaria mais a explicar por que esse resultado é válido, em vez de apenas afirmar? Você poderia oferecer uma explicação simples, clara ou intuitiva?
whuber

@whuber Melhor?
HelloGoodbye
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.