Essa é uma afirmação usual sobre a família exponencial, mas na minha opinião, na maioria das vezes, é afirmada de uma maneira que pode confundir o leitor menos experiente. Como, tirada pelo valor de face, poderia ser interpretada como dizendo "se nossa variável aleatória segue uma distribuição na família exponencial, se coletarmos uma amostra e a inserirmos na estatística suficiente, obteremos o verdadeiro valor esperado da estatística. " Se assim fosse ... Mais do que isso, não leva em consideração o tamanho da amostra, o que pode causar mais confusão.
A função de densidade exponencial é
fX(x)=h(x)eη(θ)T(x)e−A(θ)(1)
onde é a estatística suficiente.T(x)
Como essa é uma densidade, ela precisa se integrar à unidade, então ( é o suporte do )SxX
∫Sxh(x)eη(θ)T(x)e−A(θ)dx=1(2)
Eq. vale para todos para que possamos diferenciar os dois lados em relação a ele:(2)θ
∂∂θ∫Sxh(x)eη(θ)T(x)e−A(θ)dx=∂(1)∂θ=0(3)
Intercambiando a ordem de diferenciação e integração, obtemos
∫Sx∂∂θ(h(x)eη(θ)T(x)e−A(θ))dx=0(4)
Realizando a diferenciação que temos
∂∂θ(h(x)eη(θ)T(x)e−A(θ))=fX(x)[T(x)η′(θ)−A′(θ)](5)
Inserindo em obtemos(5)(4)
∫SxfX(x)[T(x)η′(θ)−A′(θ)]dx=0
⇒η′(θ)E[T(X)]−A′(θ)=0⇒E[T(X)]=A′(θ)η′(θ)(6)
Agora perguntamos: o lado esquerdo de é um número real. Portanto, o lado direito também deve ser um número real, e não uma função . Portanto, ele deve ser avaliado em um específico , e deve ser o "true" ; caso contrário, no lado esquerdo, não teríamos o verdadeiro valor esperado de . Para enfatizar isso, denotamos o valor verdadeiro por e reescrevemos como(6)θθT(X)θ0(6)
Eθ0[T(X)]=A′(θ)η′(θ)∣∣θ=θ0(6a)
Passamos agora à estimativa de probabilidade máxima . A probabilidade de log para uma amostra de tamanho én
L(θ∣x)=∑i=1nlnh(xi)+η(θ)∑i=1nT(xi)−nA(θ)
Definindo sua derivada em relação a igual a , obtemos o MLEθ0
θ^(x):1n∑i=1nT(xi)=A′(θ)η′(θ)∣∣θ=θ^(x)(7)
Compare com . Os lados direito não são iguais, pois não podemos argumentar que o estimador do MLE atingiu o valor verdadeiro. Assim também não são os lados esquerdo. Mas lembre-se dessa eq. vale para todos e, portanto, para também. Portanto, as etapas na eq. pode ser tomado em relação a e, assim, podemos escrever a eq. para :(7)(6a)2 θθ^3,4,5,6θ^6aθ^
Eθ^(x)[T(X)]=A′(θ)η′(θ)∣∣θ=θ^(x)(6b)
que, combinado com , nos leva à relação válida(7)
Eθ^(x)[T(X)]=1n∑i=1nT(xi)
que é o que a afirmação em análise realmente diz: o valor esperado da estatística suficiente sob o MLE para os parâmetros desconhecidos (em outras palavras, o valor do primeiro momento bruto da distribuição que obteremos se usarmos no lugar de ) é igual (e não é apenas aproximado por) à média da estatística suficiente, calculada a partir da amostra . θ^(x)θx
Além disso, somente se o tamanho da amostra for , poderíamos dizer com precisão: "o valor esperado da estatística suficiente no MLE é igual à estatística suficiente".n=1