Digamos que estamos em um espaço de probabilidade discreto para que . Intuitivamente, você precisa de alguma função para otimizar . Você só pode otimizar um único objetivo!f(x)∈RnU:Rn→RU(f(x))
A otimização de uma única função objetiva pode parecer bastante constrangedora, mas não é ! Em vez disso, um único objetivo pode representar preferências incrivelmente diversas que você pode ter sobre o que é uma solução melhor ou pior.
Avançando, um ponto simples para começar pode ser escolher uma variável aleatória e resolver:λ
minimize (over x)subject toE[λf(x)]x∈X
Esta é uma nova ponderação linear simples de . De qualquer forma, aqui está um argumento sobre por que o colapso de vários objetivos em um único objetivo geralmente é aceitável.
E[f(x)]
Configuração básica:
- Você tem uma variável escolha e um conjunto viável .xX
- Sua escolha de leva a um resultado aleatórioxy~=f(x)
- Você tem preferências racionais sobre o resultado aleatório. (Basicamente, você pode dizer se prefere um resultado aleatório a outro.)≺y~
Seu problema é escolher modo que:x∗∈X
∄x∈Xf(x∗)≺f(x)
Em inglês, você deseja escolher para que nenhuma opção viável leve a um resultado preferido a .
x∗xf(x∗)
Equivalência à maximização da utilidade (sob certas condições técnicas)
Por simplicidade técnica, direi que estamos em um espaço de probabilidade discreto com resultados, para que eu possa representar um resultado aleatório com um vetor .ny~y∈Rn
Sob certas condições técnicas (que não são limitativas no sentido prático), o problema acima é equivalente a maximizar uma função utilitária . (A função utilitário atribui resultados mais preferenciais a um número maior.)U(y)
Essa lógica se aplica a qualquer problema em que sua escolha leva a várias variáveis de resultado.
maximize (over x)subject toU(f(x))x∈X
Dando mais estrutura à função de utilidade : Hipótese de utilidade esperada :U
Se estamos em um cenário probabilístico e aceitamos os axiomas de Neumann-Morgernstern , a função geral de utilidade deve assumir uma forma especial:U
U(y)=E[u(yi)]=∑ipiu(yi)
Onde é a probabilidade do estado e é uma função de utilidade côncava. A curvatura de mede a aversão ao risco. Simplesmente substituindo esta forma especializada de você obtém:
piiuuU
maximize (over x)subject to∑ipiu(yi)x∈Xy=f(x)
Observe que o caso simples está maximizando o valor esperado (ou seja, sem aversão ao risco).u(yi)=yi
Outra abordagem: pesosλ
Outra coisa a fazer é:
maximize (over x)subject to∑iλiyix∈Xy=f(x)
Intuitivamente, você pode escolher pesos maiores ou menores que a probabilidade de um estado ocorrer, e isso captura a importância de um estado.λipi
A justificativa mais profunda dessa abordagem é que, sob certas condições técnicas, existem pesos lambda modo que o problema acima e os problemas anteriores (por exemplo, maximizar ) tenham a mesma solução.λU(f(x))