Haverá um número infinito de distribuições que se parecem muito com o seu desenho, com uma variedade de valores diferentes para a curtose.
Com as condições particulares da sua pergunta e considerando que mantemos o ponto de cruzamento dentro, ou pelo menos não muito longe±1 , deve ocorrer uma curtose ligeiramente maior do que a normal. Mostrarei três casos em que isso acontece e depois mostrarei um em que é menor - e explicarei o que faz com que isso aconteça.
Dado que e são os pdf e cdf normais padrão, respectivamente, vamos escrever uma pequena funçãoΦ ( x )ϕ(x)Φ(x)
f(x)={ϕ(x)a+b.g(x);|x|>t;|x|≤t
para alguma densidade simétrica contínua (com o cdf correspondente ), com média , tal que e .G 0gG0b=Φ(t)–½–t.ϕ(t)G(t)–½–t.g(t)a=ϕ(t)−b.g(t)
Ou seja, e são escolhidos para fazer a densidade contínua e integrar a .ab1
Exemplo 1 Consideree,g(x)=3ϕ(3x)t=1
que se parece com o seu desenho, gerado aqui pelo seguinte código R:
f <- function(x, t=1,
dg=function(x) 2*dnorm(2*x),
pg=function(x) pnorm(2*x),
b=(pnorm(t) - 0.5 - t*dnorm(t))/ (pg(t) - 0.5 - t*dg(t)),
a=dnorm(t)-b*dg(t) ) {
ifelse(abs(x)>t,dnorm(x),a+b*dg(x))
}
f1 <- function(x) f(x,t=1,dg=function(x) 3*dnorm(3*x),pg=function(x) pnorm(3*x))
curve(f1,-4,4,col=2)
lines(x,dnorm(x),col=3)
Agora os cálculos. Vamos criar uma função para avaliar :xpf1(x)
fp <- function(x,p=2) x^p*f1(x)
para que possamos avaliar os momentos. Primeiro a variação:
integrate(fp,-Inf,Inf) # should be just smaller than 1
0.9828341 with absolute error < 1.4e-07
Em seguida, o quarto momento central:
integrate(fp,-Inf,Inf,p=4) # should be just smaller than 3
2.990153 with absolute error < 8.3e-06
Precisamos da proporção desses números, que devem ter cerca de 5 dígitos de precisão
integrate(fp,-Inf,Inf,p=4)$value/(integrate(fp,-Inf,Inf)$value^2)
[1] 3.095515
Portanto, a curtose é de cerca de 3,0955, um pouco maior do que no caso normal.
É claro que poderíamos calculá-lo algebricamente e obter uma resposta exata, mas não há necessidade, isso nos diz o que queremos saber.
Exemplo 2 Com a funçãodefinida acima, podemos tentar para todos os tipos de's.fg
Aqui está o Laplace:
library(distr)
D <- DExp(rate = 1)
f2 <- function(x) f(x,t=1,dg=d(D),pg=p(D))
curve(f2,-4,4,col=2)
lines(x,dnorm(x),col=3)
fp2 <- function(x,p=2) x^p*f2(x)
integrate(fp2,-Inf,Inf) # should be just smaller than 1
0.9911295 with absolute error < 1.1e-07
integrate(fp2,-Inf,Inf,p=4) # should be just smaller than 3
2.995212 with absolute error < 5.9e-06
integrate(fp2,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 3.049065
Sem surpresa, um resultado semelhante.
Exemplo 3 : Vamos considerarcomo uma distribuição Cauchy (uma distribuição Student-t com 1 df), mas com a escala 2/3 (ou seja, sefor um Cauchy padrão,e, novamente, defina o limite, t (fornecendo os pontos,, fora do qual 'alternamos' para o normal), como 1.gh(x)g(x)=1.5h(1.5x)±t
dg <- function(x) 1.5*dt(1.5*x,df=1)
pg <- function(x) pt(1.5*x,df=1)
f3 <- function(x) f(x,t=1,dg=dg,pg=pg)
curve(f3,-4,4,col=2)
lines(x,dnorm(x),col=3)
fp3 <- function(x,p=2) x^p*f3(x)
integrate(fp3,-Inf,Inf) # should be just smaller than 1
0.9915525 with absolute error < 1.1e-07
integrate(fp3,-Inf,Inf,p=4) # should be just smaller than 3
2.995066 with absolute error < 6.2e-06
integrate(fp3,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 3.048917
E apenas para demonstrar que realmente temos uma densidade adequada:
integrate(f3,-Inf,Inf)
1 with absolute error < 9.4e-05
Exemplo 4 : No entanto , o que acontece quando alteramos t ?
Tome e como o exemplo anterior, mas altere o limite para :gGt=2
f4 <- function(x) f(x,t=2,dg=dg,pg=pg)
curve(f4,-4,4,col=2)
lines(x,dnorm(x),col=3)
fp4 <- function(x,p=2) x^p*f4(x)
integrate(fp4,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 2.755231
Como isso acontece?
Bem, é importante saber que a curtose é (falando levemente) 1 + a variação quadrada de :μ±σ
Todas as três distribuições têm a mesma média e variação.
A curva preta é a densidade normal padrão. A curva verde mostra uma distribuição bastante concentrada sobre (ou seja, a variação sobre é pequena, levando a uma curtose que se aproxima de 1, a menor possível). A curva vermelha mostra um caso em que a distribuição é "afastada" de ; isto é, a curtose é grande.μ±σμ±σμ±σ
Com isso em mente, se definirmos os pontos de limiar longe o suficiente fora de , podemos empurrar a curtose abaixo de 3 e ainda ter um pico mais alto.μ±σ