Em um nível puramente formal, poder-se-ia chamar a teoria das probabilidades de estudar os espaços de medida com a medida total um, mas isso seria como chamar a teoria dos números do estudo de cadeias de dígitos que terminam
- de Tópicos de Terry Tao na teoria da matriz aleatória .
Eu acho que isso é realmente fundamental. Se tivermos um espaço de probabilidade e uma variável aleatória com medida , o motivo uma densidade integra-se a uma é porque . E isso é mais fundamental do que pdfs vs pmfs.X : Ω → R P X : = P ∘ X - um f = d P X(Ω,F,P)X:Ω→RPX:=P∘X−1 P(Ω)=1f=dPXdμP(Ω)=1
Aqui está a prova:
∫Rfdμ=∫RdPX=PX(R)=P({ω∈Ω:X(ω)∈R})=P(Ω)=1.
Isso é quase uma reformulação da resposta do AdamO (+1) porque todos os CDFs são codificados, e há uma relação individual entre o conjunto de CDFs em e o conjunto de todas as medidas de probabilidade em , mas como o CDF de um RV é definido em termos de sua distribuição, vejo os espaços de probabilidade como o lugar para "começar" com esse tipo de empreendimento. ( R , B )R(R,B)
Estou atualizando para elaborar a correspondência entre CDFs e medidas de probabilidade e como ambas são respostas razoáveis para esta pergunta.
Começamos começando com duas medidas de probabilidade e analisando os CDFs correspondentes. Concluímos começando com um CDF e analisando a medida induzida por ele.
Seja e medidas de probabilidade em e e sejam seus respectivos CDFs (ou seja, e da mesma forma para ). e tanto representaria medidas pushforward de variáveis aleatórias (ou seja, distribuições), mas ele realmente não importa de onde eles vieram para isso.R ( R , B ) F Q F R F Q ( a ) = Q ( ( - ∞ , a ] ) R Q RQR(R,B)FQFRFQ(a)=Q((−∞,a])RQR
A idéia principal é a seguinte: se e concordam com uma coleção de conjuntos suficientemente rica, eles concordam com a álgebra gerada por esses conjuntos. Intuitivamente, se tivermos uma coleção bem comportada de eventos que, através de um número contável de complementos, cruzamentos e uniões, formam todos , concordar com todos esses conjuntos não deixa espaço para discordar de nenhum Borel conjunto.R σ BQRσB
Vamos formalizar isso. Seja e deixe , isto é é o subconjunto de em que e concordam (e são definidos). Note-se que estamos permitindo-lhes a concordar em conjuntos de não-Borel desde como definido ISN 't necessariamente um subconjunto de . Nosso objetivo é mostrar que .L = { A ⊆ R : Q ( A ) = R ( A ) } L P ( R ) Q R L B B ⊆ LS={(−∞,a]:a∈R}L ={A⊆ R :Q(A)=R(A)}euP( R )QReuBB ⊆ L
Acontece que (a gerada por ) é de fato , então esperamos que seja uma coleção suficientemente grande de eventos que, se todos os lugares em , em seguida, eles são forçados a ser igual em todos .σ S B S Q = R S Bσ( S)σSBSQ = RSB
Observe que é fechado sob interseções finitas e que é fechado sob complementos e interseções contáveis separadas (isso segue de -additivity). Isso significa que é um sistema e é um sistema . Pelo - teorema que, portanto, têm que . Os elementos deL σ S π L λ π λ σ ( S ) = B ⊆ L S S Q R S B ∈ BSeuσSπeuλπλσ( S) = B ⊆ LSestá longe de ser tão complexo quanto um conjunto arbitrário de Borel, mas como qualquer conjunto Borel pode ser formado a partir de um número contável de complementos, uniões e interseções de elementos de , se não houver uma única discordância entre e em elementos de , então este irá ser seguido através de não haver desacordos sobre qualquer .SQRSB ∈ B
Acabamos de mostrar que se então (em ), o que significa que o mapa para partir de para é uma injeção. Q = R B Q ↦ F Q P : = { P : P é uma medida de probabilidade em ( R , B ) } F : = { F : R → R : F é um CDF }FQ= FRQ = RBQ ↦ FQP: = { P: P é uma medida de probabilidade em ( R , B ) }F: = { F: R → R : F é um CDF }
Agora, se quisermos pensar em outra direção, queremos começar com um CDF e mostrar que existe uma medida de probabilidade única tal que . Isto irá estabelecer que o nosso mapeamento é na verdade uma bijeção. Por este sentido, definimos sem qualquer referência a probabilidade ou medidas.Q F ( a ) = Q ( ( - ∞ , a ) ) Q ↦ F Q FFQF( a ) = Q ( ( - ∞ , a ] )Q ↦ FQF
Primeiro, definimos uma função de medida Stieltjes como uma função modo queG : R → R
- G não diminui
- G é contínuo contínuo
(e observe como o càdlàg segue essa definição, mas devido à restrição extra não decrescente "a maioria" das funções do càdlàg não são funções de medida Stieltjes).
Pode-se mostrar que cada função Stieltjes induz uma medida única on definida por
(veja, por exemplo , Probabilidade e Processos Aleatórios de Durrett, para detalhes sobre isso.) Por exemplo, a medida de Lebesgue é induzida por .μ ( R , B ) μ ( ( a , b ] ) = G ( b ) - G ( a ) G ( x ) = xGμ( R , B )
μ ( ( a , b ] ) = G ( b ) - G ( a )
G ( x ) = x
Agora, observando que um CDF é uma função Stieltjes com as propriedades adicionais que e , podemos aplicar esse resultado para mostrar que, para cada CDF , obtemos uma medida única em definida por
lim x → - ∞ F ( x ) : = F ( - ∞ ) = 0Flimx → - ∞F(x):=F(−∞)=0F Q ( R , B ) Q ( ( a , b ) ) = F ( b ) - F ( a ) .limx→∞F(x):=F(∞)=1FQ(R,B)
Q((a,b])=F(b)−F(a).
Observe como e então é uma medida de probabilidade e é exatamente a que teríamos usado para definir se estivéssemos indo na outra direção.Q ( ( - ∞ , - ∞ ] ) = F ( ∞ ) - F ( - ∞ ) = 1 Q FQ((−∞,a])=F(a)−F(−∞)=F(a)Q((−∞,−∞])=F(∞)−F(−∞)=1QF
Todos juntos temos visto agora que o mapeamento é 1-1 e em assim que nós realmente temos uma bijeção entre e . Trazendo isso de volta à questão real, isso mostra que poderíamos, de maneira equivalente, sustentar CDFs ou medidas de probabilidade como nosso objeto do qual declaramos que a probabilidade é o estudo (embora reconheça que esse é um empreendimento um tanto faceta). Pessoalmente, ainda prefiro espaços de probabilidade porque sinto que a teoria flui mais naturalmente nessa direção, mas os CDFs não estão "errados".P FQ↦FQPF