Sua confusão parece surgir de variáveis aleatórias conflitantes com suas distribuições.
Para "desaprender" essa confusão, pode ser útil dar alguns passos para trás, esvaziar sua mente por um momento, esquecer qualquer formalismo sofisticado, como espaços de probabilidade e álgebras sigma (se ajudar, finja que você está de volta à escola primária) e nunca ouvi falar de nenhuma dessas coisas!) e pense no que uma variável aleatória representa fundamentalmente: um número cujo valor não temos certeza .
Por exemplo, digamos que tenho um dado de seis lados na mão. (Na verdade, tenho. Na verdade, tenho um saco inteiro deles.) Ainda não o rolei, mas estou prestes a fazê-lo, e decido ligar para o número que ainda não havia rolado naquele dado. o nome " ".X
O que posso dizer sobre esse , sem realmente rolar o dado e determinar seu valor? Bem, posso dizer que seu valor não será , , ou . De fato, posso ter certeza de que será um número inteiro entre e , inclusive, porque esses são os únicos números marcados no dado. E porque eu comprei este pacote de dados de um fabricante respeitável, posso ter certeza de que, quando rolar o dado e determinar qual é o número , é igualmente provável que seja um desses seis valores possíveis ou o mais próximo possível como eu posso determinar.7 - 1 1X7−1 16X1216X
Em outras palavras, meu é uma variável aleatória com valor inteiro distribuída uniformemente no conjunto .{ 1 , 2 , 3 , 4 , 5 , 6 }X{1,2,3,4,5,6}
OK, mas certamente tudo isso é óbvio, então por que continuo elaborando coisas tão triviais que você certamente já sabe? É porque quero enfatizar outro ponto, que também é trivial e, ao mesmo tempo, crucialmente importante: eu posso fazer contas com esse , mesmo que ainda não saiba seu valor!X
Por exemplo, posso decidir adicionar um ao número que rolarei no dado e chamar esse número pelo nome " ". Não saberei qual número esse será, já que não sei qual será o até que eu role o dado, mas ainda posso dizer que será um maior que ou, em termos matemáticos, .Q Q X Q X Q = X + 1XQQXQXQ=X+1
E este será também uma variável aleatória, porque eu não sei o seu valor ainda; Eu só sei que vai ser um maior do que . E porque eu sei que valores pode tomar, e quão provável é levar cada um desses valores, eu também pode determinar as coisas para . E você também pode, facilmente. Você realmente não precisa de nenhum formalismo ou cálculo sofisticado para descobrir que será um número inteiro entre e , e que é igualmente provável (assumindo que meu dado seja tão justo e equilibrado quanto eu acho) qualquer um desses valores.X X Q Q 2 7QXXQQ27
Mas tem mais! Eu poderia decidir, por exemplo, multiplicar o número que rolarei no dado por três e chamar o resultado . E essa é outra variável aleatória, e tenho certeza de que você também pode descobrir sua distribuição, sem precisar recorrer a integrais, convoluções ou álgebra abstrata.R = 3 XXR=3X
E se eu realmente quisesse, eu poderia até decidir pegar o número ainda a ser determinado e dobrar, girar e mutilar dividi-lo por dois, subtrair um dele e calcular o resultado ao quadrado. E o número resultante é outra variável aleatória; dessa vez, não terá valor inteiro nem distribuição uniforme, mas você ainda pode descobrir sua distribuição com bastante facilidade usando apenas lógica e aritmética elementares.S = ( 1XS=(12X−1)2
OK, para que eu possa definir novas variáveis aleatórias conectando meu dado desconhecido em várias equações. E daí? Bem, lembra quando eu disse que tinha um saco inteiro de dados? Deixe-me pegar outro e ligar para o número que eu vou rolar naquele dado com o nome " ".YXY
Esses dois dados que peguei na sacola são praticamente idênticos - se você os trocasse quando eu não estava olhando, eu não seria capaz de dizer - então posso assumir com segurança que esse também terá a mesma distribuição que . Mas o que eu realmente quero fazer é rolar os dados e contar o número total de pips em cada um deles . E esse número total de pips, que também é uma variável aleatória, pois ainda não o conheço , chamarei de " ".X TYXT
Qual será o tamanho desse número ? Bem, se é o número de sementes que irão rolar sobre a primeira matriz, e é o número de sementes que irão rolar sobre a segunda matriz, então será claramente a sua soma, ou seja, . E posso dizer que, como e estão entre um e seis, deve ter pelo menos dois e no máximo doze. E como e são números inteiros, claramente deve ser também um número inteiro.X Y T T = X + Y X Y T X Y TTXYTT=X+YXYTXYT
Mas qual a probabilidade de levar cada um de seus possíveis valores entre dois e doze? Definitivamente, não é igualmente provável que você pegue cada um deles - um pouco de experimentação revelará que é muito mais difícil jogar doze em um par de dados do que jogar, digamos, sete.T
Para descobrir isso, deixe-me indicar a probabilidade de rolar o número no primeiro dado (aquele cujo resultado eu decidi chamar ) pela expressão . Da mesma forma, denotarei a probabilidade de rolar o número no segundo dado por . Claro que, se os meus dados são perfeitamente justo e equilibrado, então para qualquer e entre um e seis anos, mas podemos também considerar o mais geral caso em que os dados possam realmente ser tendenciosos e mais propensos a rolar alguns números do que outros.X Pr [ X = a ] b Pr [ Y = b ] Pr [ X = a ] = Pr [ Y = b ] = 1aXPr[X=a]bPr[Y=b] abPr[X=a]=Pr[Y=b]=16ab
Agora, uma vez que as duas rolagens de dados será independente (eu certamente não estou pensando em fazer batota e ajustar um deles baseado em outro!), A probabilidade de que eu vou rolar sobre o primeiro dado e na segunda simplesmente seja o produto dessas probabilidades:b Pr [ X = a e Y = b ] = Pr [ X = a ] Pr [ Y = b ] .a b
Pr[X=a and Y=b]=Pr[X=a]Pr[Y=b].
(Observe que a fórmula acima é válida apenas para pares independentes de variáveis aleatórias; certamente não seria válida se substituíssemos acima por, digamos, !)QYQ
Agora, existem vários valores possíveis de e que poderiam produzir o mesmo total ; por exemplo, poderia surgir tão bem de e quanto de e , ou mesmo de e . Mas se eu já tivesse rolado o primeiro dado e soubesse o valor de , poderia dizer exatamente qual valor teria que rolar no segundo dado para atingir qualquer número total de pips.Y T T = 4 X = 1 Y = 3 X = 2 Y = 2 X = 3 Y = 1 XXYTT=4X=1Y=3X=2Y=2X=3Y=1X
Especificamente, digamos que estamos interessados na probabilidade de que , para algum número . Agora, se eu souber depois de rolar o primeiro dado que , então eu só poderia obter o total rolando no segundo dado. E, é claro, já sabemos, sem rolar nenhum dado, que a probabilidade a priori de rolar no primeiro dado no segundo dado éc X = uma T = C Y = c - um um c - uma Pr [ X = um e Y = C - um ] = Pr [ X = um ] Pr [ Y = c - um ] .T=ccX=aT=cY=c−aac−a
Pr[X=a and Y=c−a]=Pr[X=a]Pr[Y=c−a].
Mas é claro que existem várias maneiras possíveis de atingir o mesmo total , dependendo do que acabo rolando no primeiro dado. Para chegar a probabilidade total de rolar pips sobre os dois dados, eu preciso somar as probabilidades de todas as diferentes maneiras que eu poderia rolar esse total. Por exemplo, a probabilidade total de que eu jogue um total de 4 pips nos dois dados será:Pr [ T = c ] c Pr [ T = 4 ] = Pr [ X = 1 ] Pr [ Y = 3 ] + Pr [ X = 2 ] Pr [ Y = 2 ] + Pr [ X = 3 ] Pr [ Y = 1 ] + Pr [ X = 4 ]cPr[T=c]c
Pr[T=4]=Pr[X=1]Pr[Y=3]+Pr[X=2]Pr[Y=2]+Pr[X=3]Pr[Y=1]+Pr[X=4]Pr[Y=0]+…
Note que eu fui longe demais com essa soma acima: certamente não pode ser ! Mas matematicamente isso não é problema; só precisamos definir a probabilidade de eventos impossíveis como (ou ou ou ) como zero. Dessa forma, obtemos uma fórmula genérica para a distribuição da soma de duas rolagens de dados (ou, mais geralmente, quaisquer duas variáveis aleatórias independentes com valor inteiro):0 Y = 0 Y = 7 Y = - 1 Y = 1Y0Y=0Y=7Y=−1Y=12
T=X+Y⟹Pr[T=c]=∑a∈ZPr[X=a]Pr[Y=c−a].
E eu poderia perfeitamente parar minha exposição aqui, sem nunca mencionar a palavra "convolução"! Mas é claro que, se você souber como é uma convolução discreta , poderá reconhecer uma na fórmula acima. E essa é uma maneira bastante avançada de afirmar o resultado elementar acima: a função de massa de probabilidade da soma de duas variáveis aleatórias com valor inteiro é a convolução discreta das funções de massa de probabilidade dos summands.
E, é claro, substituindo a soma por uma massa integral e de probabilidade por densidade de probabilidade , obtemos um resultado análogo para variáveis aleatórias distribuídas continuamente também. E esticando suficientemente a definição de uma convolução, podemos até aplicá-la a todas as variáveis aleatórias, independentemente de sua distribuição - embora nesse ponto a fórmula se torne quase uma tautologia, já que teremos apenas definido a convolução de duas distribuições de probabilidade arbitrárias sejam a distribuição da soma de duas variáveis aleatórias independentes com essas distribuições.
Mas, mesmo assim, todo esse material com convoluções e distribuições, PMFs e PDFs é realmente apenas um conjunto de ferramentas para calcular coisas sobre variáveis aleatórias. Os objetos fundamentais que nós estamos calculando coisas sobre são os próprios variáveis aleatórias, o que realmente são apenas números cujos valores não temos certeza sobre .
U=XYV=XY
A=B⊙C⟹Pr[A=a]=∑b,cPr[B=b and C=c][a=b⊙c],
⊙[a=b⊙c][a=b⊙c]={10if a=b⊙c, andotherwise.
(A generalização desta fórmula para variáveis aleatórias não discretas é deixada como um exercício de formalismo quase inútil. O caso discreto é suficiente para ilustrar a idéia essencial, com o caso não discreto apenas adicionando um monte de complicações irrelevantes.)
Você pode verificar se essa fórmula realmente funciona, por exemplo, para adição e que, no caso especial de adicionar duas variáveis aleatórias independentes , é equivalente à fórmula de "convolução" fornecida anteriormente.
⊙
X=5Y=6Q=6R=15S=2.25T=11U=30V=15625