Funções de perda de percentil

11

A solução para o problema:

min_{m} E [| m - X |]

$\min_{m} \; E[|m-X|]$

é conhecido por ser a mediana de $X$ , mas como é a função de perda para outros percentis? Ex: o 25º percentil de X é a solução para:

min_{m} E [L (m, X)]

$\min_{m} \; E[ L(m,X) ]$

O que é $L$ neste caso?

expected-value loss-functions

— Cam.Davidson.Pilon
fonte

12

Seja $I$ a função indicadora: é igual a $1$ para argumentos verdadeiros e $0$ contrário. Escolha $0\lt\alpha\lt 1$ e defina

Λ_{α} (x) = α x I (x \geq 0) - (1 - α) x I (x < 0) .

$\Lambda_\alpha(x)=\alpha x\, I(x\ge 0) - (1-\alpha)x\, I(x\lt 0).$

Figura

Esta figura plota $\Lambda_{1/5}$ . Ele usa uma proporção precisa para ajudá-lo a medir as inclinações, que são iguais a $-4/5$ no lado esquerdo e $+1/5$ no lado direito. Nesse caso, excursões acima de $0$ são pesadamente reduzidas em comparação com excursões abaixo de $0$ .

Essa é uma função natural a ser tentada, porque pesa valores que excedem diferente de que são menores que . Vamos calcular a perda associada e, em seguida, otimizá-la. $x$ $0$ $x$ $0$

Escrevendo para a função de distribuição de e configurando , calcule $F$ $X$ $L_\alpha(m,x) = \Lambda_\alpha(x-m)$

\begin{aligned} E_{F} (L_{α} (m, X)) & = \int_{R} Λ_{α} (x - m) d F (x) \\ = α \int_{R} I (x \geq m) (x - m) d F (x) - (1 - α) \int_{R} (x - m) I (x < m) d F (x) \\ = α \int_{m}^{\infty} (x - m) d F (x) - (1 - α) \int_{- \infty}^{m} (x - m) d F (x) . \end{aligned}

$\eqalign{ \mathbb{E}_F(L_\alpha(m,X))&=\int_\mathbb{R} \Lambda_\alpha(x-m)dF(x)\\ &=\alpha\int_\mathbb{R} I(x\ge m)(x-m) dF(x) - (1-\alpha)\int_\mathbb{R} (x-m)I(x\lt m) dF(x)\\ &=\alpha\int_m^\infty(x-m)dF(x) - (1-\alpha)\int_{-\infty}^m(x-m) dF(x). }$

Figura 2

Como varia nesta ilustração com a distribuição Normal Padrão , a área total ponderada pela probabilidade de é plotada. (A curva é o gráfico de .) A plotagem à direita para mostra mais claramente o efeito da ponderação reduzida dos valores positivos, pois sem essa ponderação reduzida a plotagem seria seja simétrico sobre a origem. O gráfico do meio mostra o ideal, onde a quantidade total de tinta azul (representando ) é a menor possível. $m$ $F$ $\Lambda_{1/5}$ $\Lambda_{1/5}(x-m)dF(x)$ $m=0$ $\mathbb{E}_F(L_{1/5}(m,X))\$

Essa função é diferenciável e, portanto, seus extremos podem ser encontrados através da inspeção dos pontos críticos. A aplicação da Regra da Cadeia e do Teorema Fundamental do Cálculo para obter a derivada em relação a dá $m$

\begin{aligned} \frac{\partial}{\partial m} E_{F} (L_{α} (m, X)) & = α (0 - \int_{m}^{\infty} d F (x)) - (1 - α) (0 - \int_{- \infty}^{m} d F (x)) \\ = F (m) - α . \end{aligned}

$\eqalign{ \frac{\partial}{\partial m}\mathbb{E}_F(L_\alpha(m,X))&=\alpha\left(0-\int_m^\infty dF(x)\right) - (1-\alpha)\left(0 - \int_{-\infty}^m dF(x)\right)\\ &= F(m) - \alpha. }$

Para distribuições contínuas esta tem sempre uma soluo que, por definição, é qualquer quantil de . Para as distribuições não contínuos isto poderá não ter uma solução, mas não haverá, pelo menos, uma para que para todos os e para todos : isto também (por definição) é um quantil de . $m$ $\alpha$ $X$ $m$ $F(x)-\alpha\lt 0$ $x\lt m$ $F(x)-\alpha\ge 0$ $x\ge m$ $\alpha$ $X$

Finalmente, como e , fica claro que nem nem minimizarão essa perda. Isso esgota a inspeção dos pontos críticos, mostrando que se encaixa na conta. $\alpha\ne 0$ $\alpha\ne 1$ $m\to-\infty$ $m\to\infty$ $\Lambda_\alpha$

Como um caso especial, é a perda exibida no questão. $\mathbb{E}_F(2L_{1/2}(m,X)) = \mathbb{E}_F\left(\left|m-x\right|\right)$

— whuber
fonte

Agradeço o esforço que você faz para mostrar que a perda esperada é minimizada pelo ponto correto . Fiquei me perguntando como fazer isso sozinho para minha própria resposta, mas sua explicação é boa. (+1)

m

$m$

2

Você provou que as imagens valem 1000 palavras. Obrigado @whuber =)

— Cam.Davidson.Pilon

8

Este artigo tem sua resposta. Para ser específico, A função de perda pode ser interpretada como 'equilibrando' as diferentes regiões de massa de probabilidade em torno de através da subtração . Para a mediana, essas regiões de massa são iguais: tornando a função de perda proporcional (na expectativa de que a constante seja negligenciável) a que fornece a conclusão desejada para a mediana.

L_{0.25} (m, X) = | (X - m) (0.25 - 1 {X > m}) | .

$L_{0.25}(m,X) = \left| \left( X - m \right) \left(0.25 - \mathbf{1}\{ X > m \} \right) \right|.$

0.25

$0.25$

0.25 - 1 {X > m}

$0.25 - \mathbf{1}\{ X > m \}$

L_{0.5} (m, X) = | (X - m) (0.5 - 1 {X > m}) | = | (X - m) \times \pm 0.5 |,

$L_{0.5}(m,X) = \left| \left( X - m \right) \left(0.5 - \mathbf{1}\{ X > m \} \right) \right| = \left| \left( X - m \right) \times \pm 0.5 \right|,$

| X - m |,

$\left| X - m\right|,$

(+1) Muito bem! - não era óbvio onde procurar aquele artigo da Wikipedia; você tinha que pensar em regressão quantílica.

— whuber

Obrigado, Matthew, esta é uma ótima descoberta. Eu gosto de balancear a interpretação

— Cam.Davidson.Pilon

Ainda não entendi. De onde vem isto? Se X estiver acima do quantil, será ponderado 0,75, caso contrário 0,25? Só isso?

| (0.25) - 1 X > m) |

$|(0.25)-\mathbb{1}{X>m})|$

(X - m)

$(X-m)$

— precisa saber é o seguinte