Aprender uma variação é difícil.
É preciso um número (talvez surpreendentemente) grande de amostras para estimar bem uma variação em muitos casos. Abaixo, mostrarei o desenvolvimento do caso "canônico" de uma amostra normal de iid.
Suponha que , i = 1 , … , n são variáveis aleatórias independentes de N ( μ , σ 2 ) . Buscamos um intervalo de confiança de 100 ( 1 - α ) % para a variação, de modo que a largura do intervalo seja ρ s 2 , ou seja, a largura seja 100 ρ % da estimativa pontual. Por exemplo, se ρ = 1 / 2 , então a largura da IC é metade do valor da estimativa pontual, por exemplo, seYEui = 1 , … , nN( μ , σ2)100 ( 1 - α ) %ρ s2100 ρ %ρ = 1 / 2 , então o IC seria algo como ( 8 ,s2= 10 , com uma largura de 5. Observe também a assimetria em torno da estimativa pontual. ( s 2 é o estimador imparcial da variação).( 8 ,13 )s2
O intervalo de confiança "(em vez de" a ") para é
( n - 1 ) s 2s2
onde χ 2
( n - 1 ) s2χ2( 1 - α / 2 )( n - 1 )≤ σ2≤ ( n - 1 ) s2χ2( α / 2 )( n - 1 ),
é oquantil
βda distribuição qui-quadrado com
n-1graus de liberdade. (Isso decorre do fato de que
(n-1)s2/σ2é uma quantidade essencial em um cenário gaussiano.)
χ2β( n - 1 )βn - 1( n - 1 ) s2/ σ2
Queremos minimizar a largura para que
então resta resolver n, de modo que
( n - 1 ) ( 1
L ( n ) = ( n - 1 ) s2χ2( α / 2 )( n - 1 )- ( n - 1 ) s2χ2( 1 - α / 2 )( n - 1 )< ρ s2,
n( n - 1 ) ⎛⎝⎜1χ2( α / 2 )( n - 1 )- 1χ2( 1 - α / 2 )( n - 1 )⎞⎠⎟< ρ .
Para o caso de um intervalo de confiança de 99%, temos para ρ = 1 e N = 5321 para ρ = 0,1 . Neste último caso produz um intervalo que é ( ainda! ) 10% maior que a estimativa pontual da variância.n = 65ρ = 1n = 5321ρ = 0,1
Se o seu nível de confiança escolhido for inferior a 99%, o mesmo intervalo de largura será obtido para um valor mais baixo de . Mas, n ainda pode ser maior do que você imaginaria.nn
Um gráfico do tamanho da amostra versus a largura proporcional ρ mostra algo que parece assintoticamente linear em uma escala log-log; em outras palavras, um relacionamento semelhante à lei do poder. Podemos estimar o poder dessa relação poder-lei (grosseiramente) comonρ
α^≈ log0.1 - log1registro5321 - log65= - log10registro523165≈ - 0,525 ,
que é, infelizmente, decididamente lento!
Esse é um caso "canônico" para lhe dar uma idéia de como proceder para o cálculo. Com base em seus gráficos, seus dados não parecem particularmente normais; em particular, existe o que parece ser uma distorção perceptível.
Mas isso deve lhe dar uma idéia aproximada do que esperar. Observe que, para responder à sua segunda pergunta acima, é necessário fixar primeiro um nível de confiança, definido em 99% no desenvolvimento acima para fins de demonstração.