Segundo plano (pode ser ignorado)
Estarei pensando em termos teóricos da decisão da seguinte maneira. Um usuário deve escolher uma açãoa entre um conjunto de possibilidades A. A ação trará a ele alguma "utilidade" (noção comumente usada em economia)u(a;s) dependendo do estado da natureza s que será realizado no futuro, onde s∈S, um conjunto de todos os estados possíveis. (A utilidade é basicamente o negativo da perda, e o que se segue pode ser reformulado de forma equivalente em termos de utilidade ou perda.) O usuário tem como objetivo maximizar a utilidade esperada (ou equivalente, minimizar a perda esperada) na ação,
maxa∈AESu(a;s).
A escolha da ação é baseada na previsão do estado da natureza a ser realizado. Dada uma previsão de densidade , um usuário pode calcular a utilidade esperada de uma ação específica, integrando o utilitário dessa ação sobre a distribuição prevista dos estados da natureza,
Em seguida, ele escolhe a ação (entre todas as possíveis) que maximiza esse utilitário esperado, . O valor esperado da utilidade nesta ação, para esta previsão de densidade, é .f^S(⋅)
ES^u(a;s)=∫u(a;s)f^S(s)ds.
a^∗:=argmaxa∈AES^u(a;s)u^∗:=u(a^∗)
Se a função de utilitário tiver um máximo exclusivo (a função de perda tiver um mínimo exclusivo), a ação ideal será única. Se o estado da natureza é uma variável aleatória contínua , existe um ponto na distribuição (um estado da natureza) que produz exatamente . Esse ponto define o alvo da previsão de pontos "relevante". Portanto, o usuário obterá exatamente o mesmo utilitário esperado maximizado (sobre todas as ações possíveis), independentemente de a previsão que ele recebe seja uma previsão de densidade ou a previsão de ponto "relevante" (uma massa de probabilidade unitária em um determinado estado da natureza), desde a qualidade das duas previsões é "igualmente boa"u^∗
Parte principal (veja o plano de fundo para mais detalhes)
Eu acho que é razoável supor que a utilidade de uma previsão seja totalmente refletida pela perda que incorre a um determinado usuário. Então, o objetivo de um usuário é escolher uma previsão que minimize a perda esperada. Portanto, dada uma distribuição prevista, o usuário assumirá uma função concreta (por exemplo, média prevista) que minimiza a perda esperada. O restante da densidade prevista não terá nenhum valor agregado para o usuário.
Se a função de perda tiver um mínimo único, a função terá um valor único e esse valor será o ponto previsto para o usuário. Por exemplo, se a função de perda do usuário for quadrática (que tem um mínimo exclusivo na média da distribuição verdadeira), ele só se preocupará com a previsão da média. Se outro usuário estiver enfrentando perda absoluta (que tem um mínimo único na mediana da distribuição verdadeira), ele só se preocupará com a previsão da mediana. Fornecer uma previsão de densidade para qualquer um desses usuários, além de previsões de média e mediana, respectivamente, terá zero valor agregado para eles.
Elliott e Timmermann (2016a) escrevem na p. 423-424 (referente à avaliação das previsões de densidade):
Uma maneira de [avaliar uma previsão de densidade] seria converter a previsão de densidade em uma previsão pontual e usar os métodos para a avaliação da previsão pontual. Essa abordagem simples para avaliar previsões de densidade pode ser apropriada por vários motivos. As previsões de segurança podem ser justificadas com base no fato de que existem vários usuários com diferentes funções de perda. Qualquer um desses usuários pode examinar o desempenho de uma previsão de densidade com referência à função de perda específica considerada apropriada para o seu problema. A medida relevante do desempenho previsto é a perda média calculada a partir da função de perda específica de cada usuário.
Além disso, dada uma função de perda conhecida, uma previsão de densidade pode até ser inferior a uma previsão pontual relevante, pelos dois motivos a seguir. Primeiro, as previsões de densidade são normalmente mais difíceis de produzir do que as pontuais. Segundo, eles podem trocar precisão / exatidão em um ponto específico (digamos, média ou mediana) por precisão / exatidão em toda a distribuição que está sendo prevista. Ou seja, se alguém está prevendo toda a densidade, pode ser necessário sacrificar alguma precisão / exatidão para a previsão da média, a fim de obter maior precisão / exatidão em outro lugar. Como Elliott e Timmermann (2016b) escrevem,
[As] relações entre as regras de pontuação populares na literatura e as funções subjacentes de perda para usuários individuais não são claras. Assim, pode ser que a regra de pontuação usada forneça uma estimativa ruim do recurso da distribuição condicional que alguns usuários desejam construir.
Uma citação semelhante pode ser encontrada em Elliott e Timmermann (2016a) , p. 277-278:
Parece que o fornecimento de uma densidade preditiva é superior a relatar uma previsão pontual, pois ambos (a) podem ser combinados com uma função de perda para produzir qualquer previsão pontual; e (b) é independente da função de perda. Na estimativa clássica da densidade preditiva, nenhum desses pontos realmente se sustenta na prática. <...> [no] cenário clássico, as distribuições preditivas estimadas dependem da função de perda. Todos os parâmetros da densidade preditiva precisam ser estimados e essas estimativas requerem alguma função de perda; portanto, as funções de perda são lançadas de volta ao mix. O problema aqui é que as funções de perda que são frequentemente empregadas na estimativa de densidade não se alinham àquelas empregadas na previsão de pontos, o que pode levar a previsões de pontos inferiores. <...> Além disso,
Portanto, quando uma função de perda é fornecida, pode fazer sentido concentrar-se na previsão de um ponto específico, adaptado à função de perda, em vez de tentar prever toda a distribuição. Isso pode ser mais fácil de fazer e / ou mais preciso.
Uma pergunta crítica para mim mesmo: será que a previsão pontual "relevante" não pode ser expressa em função da densidade desconhecida, mas sim diferente (em função, não apenas do seu valor) para diferentes densidades? Em seguida, seria necessária uma previsão de densidade para descobrir em qual previsão de ponto está interessada, tornando a previsão de densidade um passo inevitável no processo de previsão de pontos.
Referências: