A função de distribuição cumulativa conjunta para o mínimo de e máximo de x ( n ) para uma amostra de n de uma distribuição gaussiana com μ médio e desvio padrão σ éx(1)x(n)nμσ
F(x(1),x(n);μ,σ)=Pr(X(1)<x(1),X(n)<x(n))=Pr(X(n)<x(n))−Pr(X(1)>x(1),X(n)<x(n)=Φ(x(n)−μσ)n−[Φ(x(n)−μσ)−Φ(x(1)−μσ)]n
onde é o CDF gaussiano padrão. A diferenciação em relação a e fornece a função de densidade de probabilidade conjuntax ( 1 ) x ( n )Φ(⋅)x(1)x(n)
f( x( 1 ), x( N ); μ , σ) =n ( n - 1 ) [ Φ ( x( N )- μσ) -Φ ( x( 1 )- μσ) ]n - 2⋅ φ ( x( N )- μσ) ⋅ϕ ( x( 1 )- μσ) ⋅ 1σ2
onde é o PDF gaussiano padrão. Tomar o log e soltar os termos que não contêm parâmetros fornece a função de probabilidade de logϕ ( ⋅ )
ℓ ( μ , σ; x( 1 ), x( N )) =( n - 2 ) log[ Φ ( x( N )- μσ) -Φ ( x( 1 )- μσ)]+logϕ(x(n)−μσ)+logϕ(x(1)−μσ)−2logσ
Isso não parece muito tratável, mas é fácil ver que ele é maximizado, seja qual for o valor de , definindo , ou seja, o ponto médio - o primeiro termo é maximizado quando o argumento de um CDF é negativo do argumento do outro; os segundo e terceiro termos representam a probabilidade conjunta de duas variáveis normais independentes.μ = μ = x ( n ) + x ( 1 )σμ=μ^=x(n)+x(1)2
Substituindo na probabilidade do log e escrevendo fornece
r=x(n)-X(1)ℓ(σ;x(1),x(n), μ )=(n-2)log[1-2Φ( - rμ^r=x(n)−x(1)
ℓ(σ;x(1),x(n),μ^)=(n−2)log[1−2Φ(−r2σ)]−r24σ2−2logσ
Esta expressão deve ser maximizada numericamente (por exemplo, com optimize
o stat
pacote de R ) para encontrar . (Acontece que , em que é uma constante dependendo apenas de talvez alguém mais matematicamente hábil do que eu poderia mostrar o porquê.) σ =k(n)⋅Rknσ^σ^=k(n)⋅rkn
As estimativas não são úteis sem uma medida de precisão. As informações de Fisher observadas podem ser avaliadas numericamente (por exemplo, com hessian
o numDeriv
pacote R ) e usadas para calcular erros padrão aproximados:
I(σ)=-∂2ℓ(σ; μ )
Eu( μ ) = -∂2ℓ ( μ ; σ^)( ∂μ )2∣∣∣μ = μ^
Eu( σ) = -∂2ℓ ( σ; μ^)( ∂σ)2∣∣∣σ= σ^
Seria interessante comparar a probabilidade e as estimativas do método dos momentos para em termos de viés (o MLE é consistente?), Variância e erro do quadrado médio. Há também a questão da estimativa para os grupos em que a média da amostra é conhecida além do mínimo e do máximo.σ