Eu estive pensando sobre esse problema um pouco mais recentemente, e aqui está o que eu inventei.
Deixe Ω ser um espaço de probabilidade, então uma variável aleatória X é uma função mensurável X : Ω → X , onde X é um espaço mensurável ( X tem um designado σ -álgebra, e X é mensurável no que diz respeito a esta σ -álgebra eo σ -álgebra em Ω ). A distribuição de X é apenas a medida de retração em X , ou seja, P X ( A ) = P Ω ( X -Ω XX: Ω → XXXσXσσΩXX1 (A)). Então umaestatísticadeXé qualquer função mensurável *f: X → Y , onde Y é outro espaço mensurável arbitrário.PX( A ) = PΩ( X- 1( A ) )Xf:X→YY
Dadas duas estatísticas f : X → Y , g : X → Z , o que significa " g ser uma função de f "?f:X→Yg:X→Zgf
Tanto quanto posso dizer, parece significar que existe uma função ** mensurável h : Y → Z tal que g = h ∘ f , ou seja, que g pode ser fatorado por f .h:Y→Zg=h∘fgf
(Em outras palavras, " g deve ser bem definido como uma função em f ( X ) ⊆ Y ".)gf( X) ⊆ Y
Então, quando é possível esse fatoramento? Vamos pensar em termos de relações de equivalência. Especificamente, defina a relação de equivalência ∼ f em X por x 1 ∼ f x 2∼fX⟺f ( x 1 ) = f ( x 2 ) , da mesma forma, defina a relação de equivalência ∼ g em X por x 1 ∼ g x 2x1∼fx2⟺f( x1) = f( x2)∼gX⟺g ( x 1 ) = g ( x 2 ) .x1∼gx2⟺g( x1) = g( x2)
Em seguida, a fim de g a ser factorável por F , as relações de equivalência ~ f e ~ g necessidade de ser compatíveis uns com os outros, no sentido em que, para qualquer *** x 1 , x 2 ∈ X , x 1 ~ f x 2gf∼f∼gx1, x2∈ X⟹x 1 ∼ g x 2 , ou seja, g não pode pegar dois elementos equivalentes em f e mapeá-los para valores que não são equivalentes em g , ou seja, " g não pode desfazer a redução de informações anteriormente executada por f ".x1∼fx2⟹x1∼gx2gfggf
Em outras palavras, g deve ser bem definido como uma função em X / ∼ f ≅ f ( X ) , ou seja, deve existir uma função ˜ g : X / ∼ f → Z tal que g = ˜ g ∘ π f , onde π f é a projeção canônica X → X / ∼ f . (Para aqueles desconfortáveis com o absurdo abstrato, π f é essencialmente f , egX/ ∼f≅f( X)g~: X/ ∼f→ Zg= g~∘ πfπfX→ X/ ∼fπff˜ g é essencialmenteh. A formulação acima apenas torna as analogias com outras situações mais claras.)g~h
Nas palavras mais simples possíveis, g pode ser escrito como função de f se e somente se, para qualquer x 1 , x 2 ∈ X , f ( x 1 ) = f ( x 2 )gfx1, x2∈ X⟹g ( x 1 ) = g ( x 2 ) .f( x1) = f( x2)⟹g( x1) = g( x2)
Por exemplo, considere X = Y = Z = R e X uma variável aleatória arbitrária com valor real e, em seguida, g : x ↦ x 2 pode ser escrito como uma função de f : x ↦ x , mas não vice-versa, porque x 1 = x 2X= Y= Z= RXg:x↦x2f:x↦x⟹x 2 1 = x 2 2 , mas 1 2 = ( - 1 ) 2 mas 1 ≠ - 1 .x1=x2⟹x21=x2212=(−1)21≠−1
Em particular, suponha que toda classe de equivalência em ∼ f seja um singleton (isto é, f é injetivo ). Então g sempre pode ser escrito como uma função de f , pois X / ∼ f ≅ X , ou seja, f ( x 1 ) = f ( x 2 )∼ffgfX/∼f≅X⟹x 1 = x 2 significa que x 1 = x 2f(x1)=f(x2)⟹x1=x2⟺f ( x 1 ) = f ( x 2 ) (em geral, para f não necessariamente injetável, apenas uma direção vale), portanto nossa condição se torna x 1 = x 2x1=x2⟺f(x1)=f(x2)f⟹g ( x 1 ) = g ( x 2 ) , que é trivialmente satisfeita paraqualquer g : X → Z . (Para definir h , ele pode fazer o que quiser em Y ∖ f ( X ) desde que seja mensurável e, em seguida, para qualquer y ∈ f ( X ) , ou seja, tal que y = f ( x ) para alguns x ∈ X , defina h para ser hx1=x2⟹g(x1)=g(x2) g:X→ZhY∖f(X)y∈f(X)y=f(x)x∈Xh: y = f ( x ) ↦ g ( x ) . Isso é bem definido quando f é injetivo, porque existe umúnico x ∈ X tal que f ( x ) = y . De maneira mais geral, isso é definido apenas quando, independentemente de qual x escolhemos em f - 1 ( y ) , g ( x ) ainda é o mesmo valor, ou seja, f ( x 1 ) = fh:y=f(x)↦g(x)f x∈Xf(x)=yxf−1(y)g(x)( x 2 ) ( = y ) ⟹g ( x 1 ) = g ( x 2 ) .)f(x1)=f(x2) (=y)⟹g(x1)=g(x2)
Além disso, olhando o Teorema 3.11 em Keener, sua declaração é meio desajeitada, mas pensando nos termos acima, acredito que pode ser reescrita como:
Suponha que T seja uma estatística suficiente ****. Então, uma condição suficiente para que T seja mínimo o suficiente é que ela possa ser escrita em função da razão de verossimilhança.TT
A partir disso, fica imediatamente claro que a razão de verossimilhança deve ser por si só mínima o suficiente.
Isso também leva à conclusão de que:
Se existem x 1 , x 2 ∈ X tal que f ( x 1 ) = f ( x 2 ) mas g ( x 1 ) ≠ g ( x 2 ) , então g não pode ser escrito como uma função de f , ou seja, existe não existe função h com g = h ∘ f .x1,x2∈Xf(x1)=f(x2)g(x1)≠g(x2)gfhg=h∘f
Portanto, a condição não é tão difícil de mostrar como eu pensava.
* Keener não trata da questão de saber se uma estatística precisa ser uma função mensurável ou apenas uma função arbitrária ou não. No entanto, tenho certeza de que uma estatística deve ser uma função mensurável, porque , caso contrário, não poderíamos definir uma distribuição para ela , ou seja, uma medida de retração.
** Se h não fosse mensurável, teríamos uma contradição porque f e g são mensuráveis e a composição de funções mensuráveis é novamente mensurável. No mínimo, h deve ser mensurável restrito a f ( X ) ⊆ Y , embora eu ache que isso significaria, na maioria dos casos razoáveis, que h teria que concordar com f ( X ) com uma função mensurável em todo Y (pegue h | f ( X ) em f ( X )hfghf(X)⊆Yhf(X)Yh|f(X)f(X)e, por exemplo, z em Y ∖ f ( X ) se existir um ponto mensurável z ∈ Z , observe que f ( X ) e Y ∖ f ( X ) devem ser mensuráveis em Y ), de modo que o wlog h possa ser considerado mensurável em todos Y .zY∖f(X)z∈Zf(X)Y∖f(X)YhY
*** Pelo menos isso é necessário e suficiente para a existência de uma função arbitrária fatorando g e acima de f , e acho que ** implica que, se existe uma função arbitrária, essa função também deve ser mensurável, uma vez que f e g são, ou seja, seria realmente uma estatística Y → Z .gffgY→Z
**** A condição dada é equivalente a T ser suficiente pelo teorema da fatoração, 3.6.T