Existe uma distribuição em forma de platô?


30

Estou procurando uma distribuição em que a densidade de probabilidade diminua rapidamente após algum ponto da média ou, em minhas próprias palavras, uma "distribuição em forma de platô".

Algo entre o gaussiano e o uniforme.


8
Você pode somar um RV gaussiano e um RV uniforme.
StrongBad 25/03

3
Às vezes, ouve-se sobre as chamadas distribuições platykurtic .
JM não é um estatístico

Respostas:


53

Você pode estar procurando por uma distribuição conhecida sob os nomes de distribuição normalizada generalizada (versão 1) , Subbotin ou distribuição de energia exponencial. É parametrizado por localização , escala e forma com pdfμσβ

β2σΓ(1 1/β)exp[-(|x-μ|σ)β]

como você pode notar, para ele se assemelha e converge para a distribuição Laplace, com converge para o normal e quando para distribuição uniforme.β = 2 β = β=1 1β=2β=

insira a descrição da imagem aqui

Se você está procurando um software que o tenha implementado, pode verificar a normalpbiblioteca para R (Mineo e Ruggieri, 2005). O que é legal nesse pacote é que, entre outras coisas, implementa a regressão com erros distribuídos normalmente generalizados, ou seja, minimizando a norma .eup


Mineo, AM e Ruggieri, M. (2005). Uma ferramenta de software para a distribuição exponencial de energia: O pacote normalp. Journal of Statistical Software, 12 (4), 1-24.


20

O comentário do @ StrongBad é uma sugestão muito boa. A soma de um VR uniforme e de um RV gaussiano pode fornecer exatamente o que você está procurando se escolher os parâmetros corretamente. E na verdade tem uma solução de formulário fechado razoavelmente agradável.

O pdf desta variável é dado pela expressão:

1 14uma[erf(x+umaσ2)-erf(x-umaσ2)]

σuma é o "raio" do VR uniforme com média zero. é o desvio padrão do VR gaussiano com média zero.σ

PDFs


3
Referência: Bhattacharjee, GP, Pandit, SNN e Mohan, R. 1963. Cadeias dimensionais envolvendo distribuições de erro retangulares e normais. Technometrics, 5, 404-406.
Tim

15

Há um número infinito de distribuições "em forma de platô".

Você buscava algo mais específico do que "entre o gaussiano e o uniforme"? Isso é um tanto vago.

Aqui está uma pergunta fácil: você sempre pode colocar uma meia-normal em cada extremidade de um uniforme:

Densidade com centro uniforme e caudas gaussianas

Você pode controlar a "largura" do uniforme em relação à escala do normal, para ter platôs mais largos ou mais estreitos, fornecendo toda uma classe de distribuições, que incluem o gaussiano e o uniforme como casos limitantes.

A densidade é:

h2πσe-1 12σ2(x-μ+W/2)2Euxμ-W/2+h2πσEuμ-W/2<xμ+W/2+h2πσe-1 12σ2(x-μ-W/2)2Eux>μ+W/2

h=1 11 1+W/(2πσ)

σ0 0W(μw/2,μ+w/2)w0σN(μ,σ2)

μ=0 0

Trama de vários exemplos deste uniforme de cauda gaussiana

Talvez possamos chamar essa densidade de "uniforme de cauda gaussiana".


11
Ach! Eu adoro assistir bolas formais vestindo um uniforme Gausian de cauda! ;)
Alexis

7

Veja minha distribuição da "Torre do Diabo" aqui [1]:

f(x)=0,3334|x|<0,9399
f(x)=0,2945/x20,9399|x|<2,3242
f(x)=0 02,3242|x|

Função de densidade de torre do diabo com parte superior plana, lados convexos, cortada em extremos

A distribuição "slip-dress" é ainda mais interessante.

É fácil construir distribuições com o formato que você deseja.

[1]: Westfall, PH (2014)
"Kurtosis as Peakedness, 1905 - 2014. RIP"
Alt. Stat. 68 (3): 191-195. doi: 10.1080 / 00031305.2014.917055
acesso público pdf: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/pdf/nihms-599845.pdf


Oi Peter - Tomei a liberdade de dar a função e inserir uma imagem, além de fornecer uma referência completa. (Se a memória serve, acho que Kendall e Stuart estão fornecendo os detalhes de um desmembramento semelhante em seu texto clássico. Se bem me lembro - já faz um bom tempo - acredito que eles também discutem que não é uma coisa pesada)
Glen_b -Reinstate Monica

Obrigado, Glen_b. Eu nunca disse que a curtose media o que os números do índice de cauda medem. Em vez disso, meu artigo prova que a curtose é, para uma classe muito ampla de distribuições, quase igual a E (Z ^ 4 * I (| Z |> 1)). Portanto, a curtose não diz claramente nada sobre o 'pico', que normalmente é encontrado no intervalo {Z: | Z | <1}. Pelo contrário, é determinado principalmente pelas caudas. Chame-o de E (Z ^ 4 * I (| Z |> 1)) se o termo "cauda pesada" tiver outro significado.
Peter Westfall

Além disso, @Glen_b a que índice de cauda você está se referindo? Existem infinitamente muitos. Os cruzamentos de cauda não definem "cauda" adequadamente. De acordo com algumas definições de cruzamento de cauda de peso da cauda, ​​N (0,1) é mais "de cauda pesada" do que 0,9999 * U (-1,1) + 0,0001 * U (-1000,1000), embora o último seja obviamente cauda mais pesada, apesar de ter caudas finitas. E, BTW, este último possui curtose extremamente alta, diferentemente de N (0,1).
quer

Não consigo me encontrar dizendo "índice da cauda" em nenhum lugar do meu comentário; Não sei ao que você está se referindo quando diz "a que índice de cauda está se referindo". Se você quer dizer algo sobre cauda pesada, a melhor coisa a fazer é verificar o que Kendall e Stuart realmente dizem; Creio que ali eles realmente comparam a razão assintótica de densidades para variáveis ​​padronizadas simétricas, mas talvez tenham sido funções sobreviventes; o ponto era deles, não meu
Glen_b -Reinstala Monica

Estranho. De qualquer forma, Kendall e Stuart entenderam errado. A curtose é obviamente uma medida do peso da cauda, ​​como meus teoremas provam.
precisa

5

f(x)

f(x)=k1 11 1+x2umapara xR

Onde:

  • uma
  • kk=umaπpecado(π2uma)

uma

insira a descrição da imagem aqui

.

uma

insira a descrição da imagem aqui


3

Outro ( EDIT : simplifiquei agora. EDIT2 : simplifiquei ainda mais, embora agora a imagem não reflita realmente esta equação exata):

f(x)=1 13αregistro(cosh(αuma)+cosh(αx)cosh(αb)+cosh(αx))

registro(cosh(x))x

umaeuphumauma=2b=1 1


Aqui está um exemplo de código em R:

f = function(x, a, b, alpha){
  y = log((cosh(2*alpha*pi*a)+cosh(2*alpha*pi*x))/(cosh(2*alpha*pi*b)+cosh(2*alpha*pi*x)))
  y = y/pi/alpha/6
  return(y)
}

fé a nossa distribuição. Vamos traçá-lo para uma sequência dex

plot(0, type = "n", xlim = c(-5,5), ylim = c(0,0.4))
x = seq(-100,100,length.out = 10001L)

for(i in 1:10){
  y = f(x = x, a = 2, b = 1, alpha = seq(0.1,2, length.out = 10L)[i]); print(paste("integral =", round(sum(0.02*y), 3L)))
  lines(x, y, type = "l", col = rainbow(10, alpha = 0.5)[i], lwd = 4)
}
legend("topright", paste("alpha =", round(seq(0.1,2, length.out = 10L), 3L)), col = rainbow(10), lwd = 4)

Saída do console:

#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = NaN" #I suspect underflow, inspecting the plots don't show divergence at all
#[1] "integral = NaN"
#[1] "integral = NaN"

E trama:

Minha distribuição baseada em log cosh

Você poderia alterar ae b, aproximadamente o início e o fim da inclinação, respectivamente, mas seria necessária mais normalização, e eu não a calculei (é por isso que estou usando a = 2e b = 1no gráfico).


2

Se você está procurando algo muito simples, com um platô central e os lados de uma distribuição triangular, pode, por exemplo, combinar distribuições de triângulo N, N dependendo da proporção desejada entre o platô e a descida. Por que triângulos, porque suas funções de amostragem já existem na maioria dos idiomas. Você escolhe aleatoriamente um deles.

Em R isso daria:

library(triangle)
rplateau = function(n=1){
  replicate(n, switch(sample(1:3, 1), rtriangle(1, 0, 2), rtriangle(1, 1, 3), rtriangle(1, 2, 4)))
}
hist(rplateau(1E5), breaks=200)

insira a descrição da imagem aqui insira a descrição da imagem aqui


2

Aqui está uma bonita: o produto de duas funções logísticas.

(1/B) * 1/(1+exp(A*(x-B))) * 1/(1+exp(-A*(x+B)))

Isso tem o benefício de não ser por partes.

B ajusta a largura e A ajusta a inclinação da queda. Abaixo, são mostrados B = 1: 6 com A = 2. Nota: Não tomei tempo para descobrir como normalizar isso corretamente.

Distribuição do platô

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.