Você está certo em ser cético em relação a essa abordagem. O método da série Taylor não funciona em geral, embora a heurística contenha um núcleo de verdade. Para resumir a discussão técnica abaixo,
- Forte concentração implica que o método da série Taylor funcione para boas funções
- As coisas podem e darão muito errado para distribuições de cauda pesada ou funções não tão agradáveis
Como a resposta de Alecos indica, isso sugere que o método da série Taylor deve ser descartado se seus dados tiverem caudas pesadas. (Profissionais de finanças, estou olhando para você.)
Como observou Elvis, o principal problema é que a variação não controla momentos superiores . Para entender o porquê, vamos simplificar o máximo possível sua pergunta para chegar à ideia principal.
Suponha que tenhamos uma sequência de variáveis aleatórias com σ ( X n ) → 0 como n → ∞ .Xnσ( Xn) → 0n → ∞
P: Podemos garantir que como n → ∞ ?E [ | Xn- μ |3] = o ( σ2( Xn) ))n → ∞ ?
Como existem variáveis aleatórias com segundos momentos finitos e terceiros momentos infinitos, a resposta é enfaticamente não . Portanto, em geral, o método da série Taylor falha mesmo em polinômios de terceiro grau . A iteração desse argumento mostra que você não pode esperar que o método da série Taylor forneça resultados precisos, mesmo para polinômios, a menos que todos os momentos de sua variável aleatória sejam bem controlados.
O que devemos fazer então? Certamente, o método funciona para variáveis aleatórias limitadas cujo suporte converge para um ponto, mas essa classe é muito pequena para ser interessante. Suponha, em vez disso, que a sequência venha de uma família altamente concentrada que satisfaça (digamos)Xn
P{|Xn−μ|>t}≤e−Cnt2(1)
para cada e alguns C > 0 . Tais variáveis aleatórias são surpreendentemente comuns. Por exemplo, quando X n é a média empíricat>0C>0Xn
Xn:=1n∑i=1nYi
de boas variáveis aleatórias (por exemplo, iid e delimitadas), várias desigualdades de concentração implicam que X n satisfaz (1). Um argumento padrão (. Ver p 10 aqui ) limita o p th momentos para tais variáveis aleatórias:YiXnp
E[|Xn−μ|p]≤(p2Cn)p/2.
Portanto, para qualquer função analítica "suficientemente agradável" (veja abaixo), podemos limitar o erro E m na aproximação da série Taylor de m- termo usando a desigualdade do triângulofEmm
Em: = ∣∣∣∣E [f( Xn) ] - ∑p = 0mf( P )( μ )p !E ( Xn- μ )p∣∣∣∣≤ 1(2Cn)(m+1)/2∑p=m+1∞|f(p)(μ)|pp/2p!
quando . Como a aproximação de Stirling dá p ! ≈ p p - 1 / 2 , o erro dos satisfaz em série de Taylor truncadasn>C/2p!≈pp−1/2
Em=O(n−(m+1)/2) as n→∞whenever∑p=0∞p(1−p)/2|f(p)(μ)|<∞.(2)
Portanto, quando está fortemente concentrado ef é suficientemente bom, a aproximação da série de Taylor é realmente precisa. A desigualdade que aparece em (2) implica que f ( p ) ( μ ) / p ! = O ( p - p / 2 ) , de modo que, em particular, nossa condição exige que f seja inteiro . Isso faz sentido porque (1) não impõe nenhuma suposição de limite a X n .Xnff(p)(μ)/p!=O(p−p/2)fXn
Vamos ver o que pode dar errado quando é singularidade (após o comentário do whuber). Suponha que escolhemos f ( x ) = 1 / x . Se tomarmos X n a partir da N o r m um l ( 1 , 1 / n ) distribuição truncado entre zero e dois, então X n for suficientemente concentrada, mas E [ f ( x n ) ] = ∞ para cada nff( x ) = 1 / xXnN o r m a l (1,1 / n)XnE[f(Xn)]=∞n. Em outras palavras, temos uma variável aleatória limitada altamente concentrada e ainda assim o método da série Taylor falha quando a função tem apenas uma singularidade.
Algumas palavras sobre rigor. Acho melhor apresentar a condição que aparece em (2) como derivada, em vez de um deus ex machina necessário em um formato rigoroso de prova / teorema. Para tornar o argumento completamente rigoroso, observe primeiro que o lado direito em (2) implica que
E[|f(Xn)|]≤∑i=0∞|f(p)(μ)|p!E[|Xn−μ|p]<∞
pela taxa de crescimento dos momentos subgaussianos de cima. Assim, o teorema de Fubini fornece
E[f(Xn)]=∑i=0∞f(p)(μ)p!E[(Xn−μ)p]
O restante da prova prossegue como acima.