Visto pelas lentes das desigualdades de probabilidade e conexões com o caso de observação múltipla, esse resultado pode não parecer tão impossível ou, pelo menos, parecer mais plausível.
Permita que com e desconhecido. Podemos escrever para .μ σ 2 X = σ Z + μ Z ∼ N ( 0 , 1 )X∼N(μ,σ2)μσ2X=σZ+μZ∼N(0,1)
Reivindicação principal : é um intervalo de confiança para que é o quantil level de uma distribuição qui-quadrado com um grau de liberdade. Além disso, uma vez que este intervalo tem exactamente cobertura quando , que é o mais estreito intervalo possível da forma para alguns .( 1 - α ) σ 2 q α α ( 1 - α ) μ = 0 [ 0 , b X 2 ) b ∈ R[0,X2/qα)(1−α)σ2qαα (1−α)μ=0[0,bX2)b∈R
Uma razão para otimismo
Lembre-se de que no caso , com , o intervalo de confiança típico para é
que é o quantil -level de um qui-quadrado com graus de liberdade. Isso, é claro, vale para qualquer . Embora este seja o intervalo mais popular (chamado de intervalo de cauda igual por razões óbvias), não é o único nem o de menor largura! Como deve ser aparente, outra seleção válida é
T = Σ n i = 1 ( X i - ˉ X ) 2 ( 1 - α ) σ 2 ( tn≥2T=∑ni=1(Xi−X¯)2 (1−α)σ2q k , a a k μ ( 0 , T
(Tqn−1,(1−α)/2,Tqn−1,α/2),
qk,aakμ(0,Tqn−1,α).
Como , então
também tem cobertura de pelo menos . ( 0 , Σ n i = 1 X 2 iT≤∑ni=1X2i( 1 - α )
(0,∑ni=1X2iqn−1,α),
(1−α)
Visto sob essa luz, podemos estar otimistas de que o intervalo na reivindicação principal é verdadeiro para . A principal diferença é que não há distribuição qui-quadrado de zero grau de liberdade para o caso de uma única observação; portanto, devemos esperar que o uso de um quantil de um grau de liberdade funcione.n=1
Meio passo em direção ao nosso destino ( explorando a cauda direita )
Antes de mergulhar em uma prova da alegação principal, vamos primeiro examinar uma alegação preliminar que não é tão forte ou satisfatória estatisticamente, mas talvez ofereça algumas informações adicionais sobre o que está acontecendo. Você pode pular para a prova da reivindicação principal abaixo, sem muito (se houver) perda. Nesta seção e na próxima, as provas - embora um pouco sutis - são baseadas apenas em fatos elementares: monotonicidade de probabilidades e simetria e unimodalidade da distribuição normal.
Reivindicação auxiliar : é um intervalo de confiança para desde que . Aqui é o quantil level de um normal padrão.( 1 - α ) σ 2 α > 1 / 2 z α α[0,X2/z2α)(1−α)σ2α>1/2zαα
Prova . epor simetria, portanto, no que se segue, podemos obter sem perda de generalidade. Agora, para e ,
e, com , vemos que
Isso funciona apenas para , pois é isso que é necessário para .| σ Z + μ | d = | - σ Z + μ | μ ≥ 0 θ ≥ 0 μ ≥ 0 P ( | X | > θ ) ≥ P ( X > θ ) = P ( σ Z + μ > θ ) ≥ P ( Z| X| = | -X|| σZ+ μ | =d| -σZ+ μ |μ ≥ 0θ ≥ 0μ ≥ 0θ = z α σ P ( 0 ≤ σ 2 < X 2 / z 2 α ) ≥ 1 - α
P ( | X| >θ)≥ P (X> θ ) = P ( σZ+ μ > θ ) ≥ P ( Z> θ / σ),
θ = zασα > 1 / 2 z α > 0P (0≤ σ2< X2/ z2α) ≥ 1 - α.
α > 1 / 2zα> 0
Isso prova a reivindicação auxiliar. Embora ilustrativo, é desagradável do ponto de vista estatístico, pois requer um absurdamente grande para funcionar.α
Comprovando a reivindicação principal
Um refinamento do argumento acima leva a um resultado que funcionará para um nível de confiança arbitrário. Primeiro, observe que
Definir e . Então,
Se pudermos mostrar que o lado direito aumenta em para cada fixo , podemos empregar um argumento semelhante ao do argumento anterior. Isso é pelo menos plausível, pois gostaríamos de acreditar que, se a média aumentar, torna-se mais provável que vejamos um valor com um módulo que exceda
P ( | X| >θ)= P ( | Z+ μ / σ| >θ / σ).
a = μ / σ≥ 0b = θ / σ≥ 0P ( | Z+ a | > b ) = Φ ( a - b ) + Φ ( - a - b ).
umabb. (No entanto, devemos observar a rapidez com que a massa está diminuindo na cauda esquerda!)
Defina . Então
Observe que e para positivo , está diminuindo em . Agora, para , é fácil ver que . Esses fatos juntos facilmente implicam que
para todo e qualquer fixo .fb( a ) = Φ ( a - b ) + Φ ( - a - b )
f′b( a ) = φ ( a - b ) - φ ( - a - b ) = φ ( a - b ) - φ ( a + b ).
f′b( 0 ) = 0vocêφ ( u )vocêa ∈ ( 0 , 2 b )φ ( a - b ) ≥ φ ( - b ) = φ ( b )f′b( a ) ≥ 0
a ≥ 0b ≥ 0
Assim, temos mostrado que para e ,
a ≥ 0b ≥ 0
P ( | Z+ a | > b ) ≥ P ( | Z| >b)=2Φ(-b).
Desvendando tudo isso, se tomarmos , obteremos
que estabelece a reivindicação principal.θ = qα--√σ
P ( X2> qασ2) ≥ P ( Z2> qα) = 1 - α,
Observação final : Uma leitura cuidadosa do argumento acima mostra que ele usa apenas as propriedades simétricas e unimodais da distribuição normal. Portanto, a abordagem funciona de forma análoga para obter intervalos de confiança a partir de uma única observação de qualquer família de escala de localização unimodal simétrica, por exemplo, distribuições de Cauchy ou Laplace.