Existe uma distribuição em forma de platô?

30

Estou procurando uma distribuição em que a densidade de probabilidade diminua rapidamente após algum ponto da média ou, em minhas próprias palavras, uma "distribuição em forma de platô".

Algo entre o gaussiano e o uniforme.

distributions normal-distribution uniform

— dontloo
fonte

8

Você pode somar um RV gaussiano e um RV uniforme.

— StrongBad 25/03

3

Às vezes, ouve-se sobre as chamadas distribuições platykurtic .

— JM não é um estatístico

53

Você pode estar procurando por uma distribuição conhecida sob os nomes de distribuição normalizada generalizada (versão 1) , Subbotin ou distribuição de energia exponencial. É parametrizado por localização , escala e forma com pdf $\mu$ $\sigma$ $\beta$

\frac{β}{2 σ Γ (1 1 / β)} \exp [- {(\frac{| x - μ |}{σ})}^{β}]

$\frac{\beta}{2\sigma\Gamma(1/\beta)} \exp\left[-\left(\frac{|x-\mu|}{\sigma}\right)^{\beta}\right]$

como você pode notar, para ele se assemelha e converge para a distribuição Laplace, com converge para o normal e quando para distribuição uniforme. $\beta=1$ $\beta=2$ $\beta = \infty$

Se você está procurando um software que o tenha implementado, pode verificar a normalpbiblioteca para R (Mineo e Ruggieri, 2005). O que é legal nesse pacote é que, entre outras coisas, implementa a regressão com erros distribuídos normalmente generalizados, ou seja, minimizando a norma . $L_p$

Mineo, AM e Ruggieri, M. (2005). Uma ferramenta de software para a distribuição exponencial de energia: O pacote normalp. Journal of Statistical Software, 12 (4), 1-24.

— Tim
fonte

20

O comentário do @ StrongBad é uma sugestão muito boa. A soma de um VR uniforme e de um RV gaussiano pode fornecer exatamente o que você está procurando se escolher os parâmetros corretamente. E na verdade tem uma solução de formulário fechado razoavelmente agradável.

O pdf desta variável é dado pela expressão:

\frac{1 1}{4 uma} [e r f (\frac{x + uma}{σ \sqrt{2}}) - e r f (\frac{x - uma}{σ \sqrt{2}})]

$\dfrac{1}{4a}\left[\mathrm{erf}\left(\dfrac{x+a}{\sigma\sqrt{2}}\right)-\mathrm{erf}\left(\dfrac{x-a}{\sigma\sqrt{2}}\right) \right]$

$a$ é o "raio" do VR uniforme com média zero. é o desvio padrão do VR gaussiano com média zero. $\sigma$

— Steve Cox
fonte

3

Referência: Bhattacharjee, GP, Pandit, SNN e Mohan, R. 1963. Cadeias dimensionais envolvendo distribuições de erro retangulares e normais. Technometrics, 5, 404-406.

— Tim

15

Há um número infinito de distribuições "em forma de platô".

Você buscava algo mais específico do que "entre o gaussiano e o uniforme"? Isso é um tanto vago.

Aqui está uma pergunta fácil: você sempre pode colocar uma meia-normal em cada extremidade de um uniforme:

Você pode controlar a "largura" do uniforme em relação à escala do normal, para ter platôs mais largos ou mais estreitos, fornecendo toda uma classe de distribuições, que incluem o gaussiano e o uniforme como casos limitantes.

A densidade é:

$\frac{h}{\sqrt{2\pi}\sigma} e^{-\frac{1}{2\sigma^2}(x-\mu+w/2)^2} \mathbb{I}_{x\leq \mu-w/2} \\ + \:\frac{h}{\sqrt{2\pi}\sigma}\quad\mathbb{I}_{\mu-w/2< x\leq \mu+w/2} \\ + \frac{h}{\sqrt{2\pi}\sigma} e^{-\frac{1}{2\sigma^2}(x-\mu-w/2)^2} \mathbb{I}_{x > \mu+w/2}$

$h = \frac{1}{1 + w/(\sqrt{2\pi}\sigma)}$

$\sigma \to 0$ $w$ $(\mu-w/2,\mu+w/2)$ $w \to 0$ $\sigma$ $N(\mu,\sigma^2)$

$\mu=0$

Talvez possamos chamar essa densidade de "uniforme de cauda gaussiana".

— Glen_b -Reinstate Monica
fonte

11

Ach! Eu adoro assistir bolas formais vestindo um uniforme Gausian de cauda! ;)

— Alexis

7

Veja minha distribuição da "Torre do Diabo" aqui [1]:

$f(x) = 0.3334$ $|x| < 0.9399$
$f(x) = 0.2945/x^2$ $0.9399 \leq |x| < 2.3242$
$f(x) = 0$ $2.3242 \leq |x|$

A distribuição "slip-dress" é ainda mais interessante.

É fácil construir distribuições com o formato que você deseja.

[1]: Westfall, PH (2014)
"Kurtosis as Peakedness, 1905 - 2014. RIP"
Alt. Stat. 68 (3): 191-195. doi: 10.1080 / 00031305.2014.917055
acesso público pdf: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/pdf/nihms-599845.pdf

— Peter Westfall
fonte

Oi Peter - Tomei a liberdade de dar a função e inserir uma imagem, além de fornecer uma referência completa. (Se a memória serve, acho que Kendall e Stuart estão fornecendo os detalhes de um desmembramento semelhante em seu texto clássico. Se bem me lembro - já faz um bom tempo - acredito que eles também discutem que não é uma coisa pesada)

— Glen_b -Reinstate Monica

Obrigado, Glen_b. Eu nunca disse que a curtose media o que os números do índice de cauda medem. Em vez disso, meu artigo prova que a curtose é, para uma classe muito ampla de distribuições, quase igual a E (Z ^ 4 * I (| Z |> 1)). Portanto, a curtose não diz claramente nada sobre o 'pico', que normalmente é encontrado no intervalo {Z: | Z | <1}. Pelo contrário, é determinado principalmente pelas caudas. Chame-o de E (Z ^ 4 * I (| Z |> 1)) se o termo "cauda pesada" tiver outro significado.

— Peter Westfall

Além disso, @Glen_b a que índice de cauda você está se referindo? Existem infinitamente muitos. Os cruzamentos de cauda não definem "cauda" adequadamente. De acordo com algumas definições de cruzamento de cauda de peso da cauda, N (0,1) é mais "de cauda pesada" do que 0,9999 * U (-1,1) + 0,0001 * U (-1000,1000), embora o último seja obviamente cauda mais pesada, apesar de ter caudas finitas. E, BTW, este último possui curtose extremamente alta, diferentemente de N (0,1).

— quer

Não consigo me encontrar dizendo "índice da cauda" em nenhum lugar do meu comentário; Não sei ao que você está se referindo quando diz "a que índice de cauda está se referindo". Se você quer dizer algo sobre cauda pesada, a melhor coisa a fazer é verificar o que Kendall e Stuart realmente dizem; Creio que ali eles realmente comparam a razão assintótica de densidades para variáveis padronizadas simétricas, mas talvez tenham sido funções sobreviventes; o ponto era deles, não meu

— Glen_b -Reinstala Monica

Estranho. De qualquer forma, Kendall e Stuart entenderam errado. A curtose é obviamente uma medida do peso da cauda, como meus teoremas provam.

— precisa

5

$f(x)$

f (x) = k \frac{1 1}{1 1 + x^{2 uma}} para x \in R

$f(x) = k \frac{1}{1 + x^{2 a}} \quad \quad \text{for } x \in \mathbb{R}$

Onde:

$a$
$k$ $k = \frac{a}{\pi} \sin \left(\frac{\pi}{2 a}\right)$

$a$

.

$a$

— wolfies
fonte

3

Outro ( EDIT : simplifiquei agora. EDIT2 : simplifiquei ainda mais, embora agora a imagem não reflita realmente esta equação exata):

f (x) = \frac{1 1}{3 \cdot α} \cdot registro (\frac{\cosh (α \cdot uma) + \cosh (α \cdot x)}{\cosh (α \cdot b) + \cosh (α \cdot x)})

$f(x) = \frac{1}{3 \cdot \alpha} \cdot \log{\left( \frac{\cosh{\left(\alpha \cdot a\right)}+ \cosh{\left(\alpha \cdot x\right)}} {\cosh{\left(\alpha \cdot b\right)}+ \cosh{\left(\alpha \cdot x\right)}} \right)}$

$\log(\cosh(x))$ $x$

$alpha$ $a = 2$ $b = 1$

Aqui está um exemplo de código em R:

f = function(x, a, b, alpha){
  y = log((cosh(2*alpha*pi*a)+cosh(2*alpha*pi*x))/(cosh(2*alpha*pi*b)+cosh(2*alpha*pi*x)))
  y = y/pi/alpha/6
  return(y)
}

fé a nossa distribuição. Vamos traçá-lo para uma sequência dex

plot(0, type = "n", xlim = c(-5,5), ylim = c(0,0.4))
x = seq(-100,100,length.out = 10001L)

for(i in 1:10){
  y = f(x = x, a = 2, b = 1, alpha = seq(0.1,2, length.out = 10L)[i]); print(paste("integral =", round(sum(0.02*y), 3L)))
  lines(x, y, type = "l", col = rainbow(10, alpha = 0.5)[i], lwd = 4)
}
legend("topright", paste("alpha =", round(seq(0.1,2, length.out = 10L), 3L)), col = rainbow(10), lwd = 4)

Saída do console:

#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = NaN" #I suspect underflow, inspecting the plots don't show divergence at all
#[1] "integral = NaN"
#[1] "integral = NaN"

E trama:

Você poderia alterar ae b, aproximadamente o início e o fim da inclinação, respectivamente, mas seria necessária mais normalização, e eu não a calculei (é por isso que estou usando a = 2e b = 1no gráfico).

— Firebug
fonte

2

Se você está procurando algo muito simples, com um platô central e os lados de uma distribuição triangular, pode, por exemplo, combinar distribuições de triângulo N, N dependendo da proporção desejada entre o platô e a descida. Por que triângulos, porque suas funções de amostragem já existem na maioria dos idiomas. Você escolhe aleatoriamente um deles.

Em R isso daria:

library(triangle)
rplateau = function(n=1){
  replicate(n, switch(sample(1:3, 1), rtriangle(1, 0, 2), rtriangle(1, 1, 3), rtriangle(1, 2, 4)))
}
hist(rplateau(1E5), breaks=200)

— agenis
fonte

2

Aqui está uma bonita: o produto de duas funções logísticas.

(1/B) * 1/(1+exp(A*(x-B))) * 1/(1+exp(-A*(x+B)))

Isso tem o benefício de não ser por partes.

B ajusta a largura e A ajusta a inclinação da queda. Abaixo, são mostrados B = 1: 6 com A = 2. Nota: Não tomei tempo para descobrir como normalizar isso corretamente.

— Adjwilley
fonte