Detecção de outlier em distribuições beta


8

Digamos que eu tenha uma grande amostra de valores em . Gostaria de estimar a distribuição subjacente . A maioria das amostras vem dessa distribuição assumida , enquanto o restante são discrepantes que eu gostaria de ignorar na estimativa de e .Beta ( α , β ) Beta ( α , β ) α β[0,1]Beta(α,β)Beta(α,β)αβ

Qual é uma boa maneira de proceder sobre isso?

A padrão: usada nos boxplots seria uma aproximação ruim?Inliers={x[Q11.5IQR,Q3+1.5IQR]}

Qual seria uma maneira mais fundamentada de resolver isso? Existem prévias específicas em e que funcionariam bem nesse tipo de problema?βαβ

                    insira a descrição da imagem aqui


considere a resposta postada aqui . Depois que os outliers forem sinalizados, remova-os e use o ajuste de distribuição do MLE nas observações restantes. Será mais preciso pelos motivos explicados no link.
User603 14/05

Respostas:


1

Uma maneira mais sistemática de lidar com esse problema seria usar um modelo explícito de mistura, com uma especificação da distribuição dos 'outliers'. Uma forma simples seria usar uma mistura de uma distribuição beta (para os pontos em que você está interessado) e uma distribuição uniforme (para os 'outliers'). Ao modelar os dados como uma distribuição de mistura, você pode obter estimativas de e que automaticamente levam em consideração o fato de que alguns dos pontos podem ser discrepantes.βαβ

Para resolver esse problema usando um modelo de mistura, seja a probabilidade de um 'outlier' e assuma que você tenha os valores IID . A função de probabilidade para os dados observados é:X 1 , . . . , X n ~ φ L ( 0 , 1 ) + ( 1 - φ ) Beta ( α , β )ϕX1,...,XnϕU(0,1)+(1ϕ)Beta(α,β)

Lx(α,β,ϕ)=i=1n(ϕ+(1ϕ)Γ(α+β)Γ(α)Γ(β)xiα1(1xi)β1).

Você pode prosseguir a partir daqui usando MLE clássico ou estimativa bayesiana. Qualquer um exigirá técnicas numéricas. Tendo estimado os três parâmetros no modelo, você teria uma estimativa de e que incorpora automaticamente a possibilidade de discrepâncias. Você também teria uma estimativa da proporção de discrepantes do modelo de mistura.αβ

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.