Suponha que é um conjunto de resultados mutuamente exclusivos de uma variável aleatória discreta ef é uma função de utilidade em que 0 < f ( ω ) ≤ 1 , ∑ Ω f ( ω ) = 1 , etc.
Quando é uniformemente distribuída ao longo Ω e F é uma função de densidade de probabilidade , a entropia de Shannon H ( Ω ) = Σ Ω f ( ω ) l S g 1 é maximizado (=log|Ω|), e quando um elemento emΩtem todaa massadef, a entropia de Shannon é minimizada (0, de fato). Isso corresponde a intuições sobrevariáveis surpreendentes(ouredução da incerteza) e resultados eincerteza(ousurpresas esperadas) e aleatórias:
- Quando é uniformemente distribuído, a incerteza é maximizada e quanto mais resultados houver para a massa ser uniformemente distribuída, mais incertos somos.
- Quando tem toda a sua massa concentrada em um resultado, não temos incerteza.
- Quando atribuímos a um resultado uma probabilidade de , não obtemos informações (não estamos surpresas) quando realmente as observamos.
- Quando atribuímos a um resultado uma probabilidade cada vez mais próxima de , a observação da ocorrência real se torna cada vez mais informativa ("surpreendente").
(Tudo isso não diz nada sobre a interpretação muito mais concreta - mas menos epistêmica - da informação / entropia de Shannon, é claro).
No entanto, quando tem a interpretação de uma função de utilidade , existe uma interpretação sensorial de l o g 1 ou∑f(ω)log1 ? Parece-me que pode haver:
- se como um PMF representa uma distribuição uniforme sobre Ω , então f como uma função de utilidade corresponde à indiferença sobre os resultados que não poderiam ser maiores *
- uma função de utilidade em que um resultado tem toda a utilidade e o restante não tem nenhuma (tão distorcida quanto possível), corresponde a preferências relativas muito fortes - falta de indiferença.
Existe uma referência expandindo isso? Perdi alguma coisa sobre as limitações na comparação de funções de massa de probabilidade e utilitários relativos normalizados sobre variáveis aleatórias discretas?
* Estou ciente das curvas de indiferença e não vejo como elas podem ser relevantes para minha pergunta por vários motivos, começando com meu foco em um espaço de amostra categórico e com o fato de não estar interessado em 'indiferença', mas como interpretar utilidades como probabilidades e como interpretar funcionais em probabilidades quando a (discreta) 'distribuição de probabilidades' em questão realmente ou (adicionalmente) tem a interpretação de uma função de utilidade.