Versão de otimização de problemas de decisão

Sabe-se que cada problema de otimização / pesquisa tem um problema de decisão equivalente. Por exemplo, o problema do caminho mais curto

optimização / pesquisa versão: Dado um gráfico não ponderada não dirigida e dois vértices , encontrar o caminho mais curto entre e . $G = (V, E)$ $v,u\in V$ $v$ $u$

versão decisão: Dado um gráfico não ponderada não dirigida , dois vértices , e um número inteiro não negativo , existe um caminho em entre e , cujo comprimento é no máximo ? $G = (V, E)$ $v,u\in V$ $k$ $G$ $u$ $v$ $k$

Em geral, "Encontre st !" torna-se "Existe st ?". $x^*\in X$ $f(x^*) = \min\{f(x)\mid x\in X\}$ $x\in X$ $f(x) \leq k$

Mas o inverso também é verdadeiro, ou seja, existe um problema de otimização equivalente para cada problema de decisão? Caso contrário, qual é o exemplo de um problema de decisão que não possui um problema de otimização equivalente?

— Luke Miles
fonte

Esse bit é igual a zero?

— Jeffe

Você precisa explicar "equivalente" com mais detalhes, por exemplo, você quer dizer que um pode ser resolvido usando o outro como um oráculo / caixa preta em tempo polinomial (ou em espaço logarítmico)? Você se preocupa com todos os problemas ou apenas com problemas dentro de ?

NP $\sf{NP}$

— Kaveh

Dependendo do seu ponto de vista, a pergunta é trivial (tome qualquer problema de decisão que não tenha um " ") ou não responda (como provar que "não existe um problema de opção equivalente"?).

k $k$

— Raphael

Como já mencionado nos comentários, isso depende das definições, como de costume. Minha tentativa de responder a isso precisa de algumas definições, portanto esse será outro exemplo de minha incapacidade de fornecer respostas concisas.

Definição: Um problema de otimização é uma tupla com $(X,F,Z,\odot)$

$X$ o conjunto de instâncias ou entradas adequadamente codificadas (cadeias) .
$F$ é uma função que mapeia cada instância para um conjunto de soluções viáveis de . $x\in X$ $F(x)$ $x$
$Z$ é a função objetivo que mapeia cada par , onde e , para um número real chamado valor de . $(x, y)$ $x \in X$ $y\in F(x)$ $Z(x, y)$ $y$
$\odot$ é a direção da otimização , ou . $\min$ $\max$

Definição: Uma solução ideal de uma instância de um problema de otimização é uma solução viável para a qual . O valor de uma solução ótima é indicado com e chamado de ideal . $x\in X$ $P_O$ $y\in F(x)$ $Z(x, y)=\odot\{Z(x, y')\mid y'\in F(x)\}$ $Opt(x)$

Definição: O problema de avaliação , denominado , correspondente ao problema de otimização é o seguinte: Dada uma instância , calcule se tiver uma solução ideal e, caso contrário, não produzir uma solução ótima. $P_E$ $P_O$ $x\in X$ $Opt(x)$ $x$

Observe que isso apenas pede o valor da solução ideal, não a solução inteira com todos os seus detalhes.

Definição: O problema de decisão , denominado correspondente ao problema de otimização é o seguinte: Dado um par , onde e , decidem se tem uma solução viável tal que se e tal que $P_D$ $P_O$ $(x, k)$ $x\in X$ $k\in\mathbb{Q}$ $x$ $y$ $Z(x, y)\le k$ $\odot=\min$ se . $Z(x, y)\ge k$ $\odot=\max$

Uma primeira observação é agora que . A prova não é difícil e omitida aqui. $P_O\in \mathrm{NPO} \Rightarrow P_D\in \mathrm{NP}$

Agora intuitivamente e correspondendo a não são mais difíceis do que si. Para expressar formalmente esse sentimento (definindo assim o que significa equivalente ), usaremos reduções. $P_E$ $P_D$ $P_O$ $P_O$

Lembre-se de que um idioma é redutível em tempo polinomial para outro idioma se houver uma função , computável em tempo polinomial, tal que para todas as palavras , . Esse tipo de redutibilidade é conhecido como Karp ou redutibilidade muitos-para-um , e se é redutível a dessa maneira, expressamos isso escrevendo $L_1$ $L_2$ $f$ $x$ $x\in L_1\Leftrightarrow f(x)\in L_2$ $L_1$ $L_2$ $L_1\le_m L_2$ . Este é um conceito central na definição de NP-completude.

Infelizmente, reduções muitos para um variam entre idiomas e não está claro como empregá-los no contexto de problemas de otimização. Portanto, precisamos considerar um tipo diferente de redutibilidade, a redutibilidade de Turing . Primeiro, precisamos disso:

Definição: Um oráculo para um problema é uma sub-rotina (hipotética) que pode resolver instâncias de em tempo constante. $P$ $P$

Definição: Uma problema é de tempo polinomial Turing-redutível a um problema , escrita , se exemplos de pode ser resolvido no tempo polinomial por um algoritmo com acesso a um Oracle para . $P_1$ $P_2$ $P_1\le_T P_2$ $P_1$ $P_2$

Informalmente, assim como com , a relação expressa que não é mais difícil que . Também é fácil ver que, se pode ser resolvido em tempo polinomial, também pode . Novamente é uma relação transitiva. O seguinte fato é óbvio: $\le_m$ $P_1\le_T P_2$ $P_1$ $P_2$ $P_2$ $P_1$ $\le_T$

Vamos , então . $P_O\in \mathrm{NPO}$ $P_D\le_T P_E\le_T P_O$

Porque, dada a solução completa, calcular seu valor e decidir se atende ao limite são simples. $k$

Definição: Se por dois problemas e ambas as relações , mantiverem, escrevemos ; nossa noção de equivalência . $P_1$ $P_2$ $P_1\le_T P_2$ $P_2\le P_1$ $P_1\equiv_T P_2$

Estamos agora pronto para a prova de que dado o problema de optimização correspondente é e é um valor inteiro. Temos que mostrar que mantém. Podemos determinar com um binário procurar usign o orcale para . A definição de $P_D\equiv_T P_E$ $P_O\in \mathrm{NPO}$ $Z$ $P_E \le_T P_D$ $\odot\{Z(x,y)\mid y\in F(x)\}$ $P_D$ $\mathrm{NPO}$ assegura que para algum polinômio, portanto, o número de etapas na pesquisa binária é polinomial em. $|Z(x, y)|\le 2^{q(|x|)}$ $q$ $|x|$ $\Box$

Para um problema de otimização a relação com é menos clara. Em muitos casos concretos, pode-se demonstrar directamente que . Para provar que isso geralmente ocorre dentro da estrutura apresentada aqui, precisamos de uma suposição adicional. $P_O$ $P_E$ $P_D\equiv_T P_E \equiv_T P_O$

Primeiro, precisamos estender de pares de idiomas para pares dos problemas de decisão correspondentes. Então é fácil ver que é mais geral que . $\le_m$ $\le_T$ $\le_m$

Sejam e problemas de decisão; então . Isso ocorre porque uma redução muitos-para-um pode ser interpretada como o uso de um oráculo de maneira muito restrita: o oráculo é chamado uma vez, no final, e seu resultado também é retornado como o resultado geral. $P$ $P'$ $P\le_m P' \Rightarrow P\le_T P'$ $\Box$

Agora estamos prontos para o final:

Vamos e suponha é número inteiro com valor e que é NP-completa, em seguida, Com as observações anteriores, continua a mostrar . Para fazer isso, irá apresentar um problema tal que . Então nós temos $P_O\in \mathrm{NPO}$ $Z$ $P_D$

P D \equiv T P E \equiv T P O .

$P_D\equiv_T P_E \equiv_T P_O.$

PO≤TPE $P_O\le_T P_E$

P′O∈NPO $P_O'\in \mathrm{NPO}$

PO≤TP′E $P_O\le_T P_E'$

O segundo e o terceiro

valem por causa da equivalência da versão de decisão e avaliação comprovada anteriormente. O terceiro

decorre da completude NP de

e dos dois fatos mencionados anteriormente, a saber,

P O \leq T P' E \leq T P' D \leq T P D \leq T P E .

$P_O\le_T P_E' \le_T P_D'\le_T P_D\le_T P_E.$

≤T $\le_T$

PD $P_D$

PO∈NPO⇒PD∈NP $P_O\in \mathrm{NPO} \Rightarrow P_D\in \mathrm{NP}$

.P≤mP′O⇒P≤TP′O $P\le_m P_O' \Rightarrow P\le_T P_O'$

Agora os detalhes: Assume-se que as soluções viáveis de são codificados usando um alfabeto equipado com uma ordem total. Seja as palavras de listadas em ordem de comprimento não decrescente e ordem lexicográfica dentro dos blocos de palavras com comprimento comum. (Assim, é a palavra vazia.) Para todo deixe denotar o inteiro único tal que . Ambos $P_O$ $\Sigma$ $w_0, w_1, \ldots$ $\Sigma^*$ $w_0$ $y\in\Sigma^*$ $\sigma(y)$ $i$ $y=w_i$ $\sigma$ e pode ser calculado em tempo polinomial. Seja um polinômio tal que, para todo e todo , tenhamos . $\sigma^{-1}$ $q$ $x\in X$ $y\in F(x)$ $\sigma(y)<2^{q(|x|)}$

Agora o problema é idêntico ao excepto para uma função objectivo modificado . Para e , tomamos . $P_O'$ $P_O$ $Z'$ $x\in X$ $y\in F(x)$ $Z'(x, y)=2^{q(|x|)}\cdot Z(x,y)+\sigma(y)$ $Z'$ é calculável no tempo polinomial assim . $P_O'\in \mathrm{NPO}$

Para mostrar que observamos que é viável para se e somente se é viável para . Podemos assumir que esse é o caso, pois o caso oposto é trivial de lidar. $P_O\le_T P_E'$ $x$ $P_O$ $P_E'$

A substituição de por é monotônica no sentido de que, para todo , se então . Isso implica que toda solução ideal para $Z'$ $Z$ $y_1, y_2\in F(x)$ $Z(x, y_1)<Z(x, y_2)$ $Z'(x, y_1)<Z'(x, y_2)$ $x$ em é uma solução óptima de em . Assim, a nossa tarefa reduz para o cálculo de uma solução óptima de em . $P_O'$ $x$ $P_O$ $y$ $x$ $P_O'$

Consultando o oráculo para , podemos obter o valor de . Formar o restante deste número, o módulo produz partir do qual pode ser calculado em tempo polinomial. $P_E'$ $Z'(x,y)=2^{q(|x|)}\cdot Z(x,y)+\sigma(y)$ $2^{q(|x|)}$ $\sigma(y)$ $y$

— uli
fonte

"Um oráculo para um problema P é uma sub-rotina (hipotética) que pode resolver instâncias de P em tempo constante." Um oráculo deve levar apenas tempo constante?

— Tim

@ Tim É claro que existem livros, listei alguns nos comentários de outra resposta

— uli

@ Tim Em relação ao Oracle: Se você encontrou / concebeu uma redução

entre dois problemas

de ter reduzido o problema de encontrar um algoritmo eficiente para

a encontrar um algoritmo eficiente para

. Ou em outras palavras a redução diz-lhe que, a fim de resolver

você pode usar

. É como usar uma sub-rotina para

em um algoritmo para

. No entanto, os problemas

A≤TB $A\le_T B$

A $A$

B $B$

A $A$

B $B$

A $A$

B $B$

A $A$

$B$ geralmente são problemas em que não conhecemos soluções eficientes. E, no caso da redutibilidade de Turing, até a usamos nos casos em que os problemas envolvidos não são decididos.

— 21712 uli

Assim,

é uma sub-rotina desconhecida. Tornou-se um costume em teoria da complexidade para chamar o algoritmo hipotético para

derivado da redução como um algoritmo com a Oracle . Chamando a sub-rotina desconhecido para

um oráculo apenas expressa que não podemos esperar para encontrar um algoritmo eficiente para

, assim como não podemos esperar obter um oráculo para

. Essa escolha é um tanto infeliz, pois conota uma habilidade mágica. O custo para o oráculo deve ser

como uma sub-rotina, pelo menos, leia a entrada

. $B$

$A$ $B$

$B$

$|x|$

$x$

— 21312 uli

Uma excelente resposta ao redor; a única coisa que eu acrescentaria (chegando agora a ela através de outra pergunta) é que a "direção da otimização" é um pouco desnecessário de complexidade e, para concretizar, sempre podemos presumir que a função objetivo

deve ser maximizada; se a intenção é minimizar, então podemos apenas definir uma nova função objetiva

e reescrever toda a minimização de

como maximização de

. $Z$

$Z'=-Z$

$Z$

$Z'$

— Steven Stadnicki

Como dizem os comentários, a resposta depende das definições exatas. Deixe-me interpretar a questão de uma maneira muito básica (até ingênua).

Vamos haver alguma relação, isto é . $S$ $S \subseteq \{ (a,b) \mid a,b \in \Sigma^*\}$

Agora, definimos um problema de pesquisa para : $S$

Dada , encontrar um tal que . $a$ $b$ $(a,b) \in S$

e um problema de decisão para : $S$

Dada resposta ou não . $(a,b)$ $(a,b) \in S$

_{(for instance, in the example given in the question, $S$ will hold all the pairs $(u,v,k)$ such that there exists a path between $u$ and $v$ which is shorter than $k$ .)}

Note that these two problems are well defined. For this definition, we can ask whether the two problems are "equivalent" for any $S$ . In "equivalent" I mean that if one of them is computable (i.e., there exists an algorithm that solves it) than the other one is computable as well. In general, they are not.

Claim 1: Decision implies Search.

Proof: Let $D_S$ be the algorithm that solves the decision problem of $S$ . Given an input $a$ , We can run $D_S(a,x)$ for any $x\in \Sigma^*$ , one after the other, or in parallel. If there exists $b$ such that $(a,b)\in S$ , we will eventually find it. If not, the algorithm might not stop $^\dagger$ .

Claim 2: Search does not imply Decision.

The reason is that the search algorithm might return a different $b$ than the one we need. That is, for every $a$ there is some $b$ that is very easy to find, but other $b'$ that is not. For instance, let $L$ be some undecidable language, then define

$S = \{ (x,0) \mid x\in \Sigma^*\} \cup \{ (x,1) \mid x \in L\}.$ For every

$x$ the search algorithm can return

$0$ . But no decision algorithm can answer correctly whether

$(x,1) \in S$ , for all the pairs

$(x,1)$ . If it could, it would have decided an undecidable problem, which is impossible.

$^\dagger$ This depends on $S$ . If, for instance, $S$ is bounded, there might exists an algorithm that does stop.

— Ran G.
fonte

The right decision problem is existence of

$b$ s.t.

$\langle a,b \rangle \in S$ .

— Kaveh

If decision is defined as the existence of

$b$ , then search implies decision.

— Ran G.

In a weak sense, i.e. w.r.t. computability but not complexity is a more delicate issue.

— Kaveh