(Para saber por que escrevi isso, verifique os comentários abaixo da minha resposta a esta pergunta .)
Erros do tipo III e teoria da decisão estatística
Às vezes, dar a resposta certa à pergunta errada é chamado de erro Tipo III. A teoria da decisão estatística é uma formalização da tomada de decisão sob incerteza; fornece uma estrutura conceitual que pode ajudar a evitar erros do tipo III. O elemento chave da estrutura é chamado de função de perda . São necessários dois argumentos: o primeiro é (o subconjunto relevante) o verdadeiro estado do mundo (por exemplo, em problemas de estimativa de parâmetros, o verdadeiro valor do parâmetro ); o segundo é um elemento no conjunto de ações possíveis (por exemplo, em problemas de estimativa de parâmetros, a estimativaq ). A saída modela a perda associada a todas as ações possíveis em relação a todos os possíveis estados reais do mundo. Por exemplo, em problemas de estimativa de parâmetros, algumas funções de perda bem conhecidas são:
- a perda de erro absoluta
- a perda de erro ao quadrado
- Perda LINEX de Hal Varian
Examinando a resposta para encontrar a pergunta
Há um caso em que se pode tentar fazer com que erros do tipo III possam ser evitados, concentrando-se na formulação de uma função de perda correta e prosseguindo com o restante da abordagem teórica da decisão (não detalhada aqui). Esse não é o meu resumo - afinal, os estatísticos estão bem equipados com muitas técnicas e métodos que funcionam bem, mesmo que não sejam derivados dessa abordagem. Mas o resultado final, parece-me, é que a grande maioria dos estatísticos não conhece e não se importa com a teoria da decisão estatística, e acho que eles estão perdendo. Para esses estatísticos, eu argumentaria que a razão pela qual eles podem achar valiosa a teoria da decisão estatística em termos de evitar erros do tipo III é porque ela fornece uma estrutura na qual é possível solicitar qualquer procedimento de análise de dados proposto:com qual função de perda (se houver) o procedimento lida de maneira ideal? Ou seja, em que situação de tomada de decisão exatamente ela fornece a melhor resposta?
Perda esperada posterior
De uma perspectiva bayesiana, a função de perda é tudo o que precisamos. Podemos pular o restante da teoria da decisão - quase por definição, a melhor coisa a fazer é minimizar a perda esperada posterior, ou seja, encontrar a ação que minimiza .˜ L ( a ) = ∫ Θ L ( θ , a ) p ( θ | D ) d θ
(E quanto às perspectivas não bayesianas? Bem, é um teorema da teoria da decisão freqüentista - especificamente, o Teorema da Classe Completa de Wald - de que a ação ideal sempre será minimizar a perda esperada posterior bayesiana em relação a alguns (possivelmente impróprios) A dificuldade com esse resultado é que o teorema da existência não fornece orientação quanto ao uso anterior, mas restringe frutuosamente a classe de procedimentos que podemos "inverter" para descobrir exatamente qual é a pergunta que estamos fazendo. Em particular, o primeiro passo para inverter qualquer procedimento não bayesiano é descobrir qual procedimento bayesiano (se houver) ele replica ou aproxima.)
Ei, Cyan, você sabe que este é um site de perguntas e respostas, certo?
O que me leva - finalmente - a uma questão estatística. Nas estatísticas bayesianas, ao fornecer estimativas de intervalo para parâmetros univariados, dois procedimentos comuns de intervalo credível são o intervalo credível baseado em quantil e o maior intervalo credível de densidade posterior. Quais são as funções de perda por trás desses procedimentos?