"Onde estão os problemas realmente difíceis" se sustentaram? Quais são as idéias atuais sobre o assunto?

Achei este artigo muito interessante. Para resumir: ele discute por que, na prática, você raramente encontra a pior das hipóteses de um problema completo de NP. A idéia no artigo é que as instâncias geralmente são muito sub ou muito restritas, e ambas são relativamente fáceis de resolver. Em seguida, propõe para alguns problemas uma medida de 'constrangimento'. Esses problemas parecem ter uma 'transição de fase' da probabilidade 0 de uma solução para 100%. Ele então propõe:

Que todos os problemas de NP completos (ou mesmo todos os problemas de NP) têm uma medida de 'constrangimento'.
Que para cada problema NP-completo, você pode criar um gráfico da probabilidade de uma solução existir em função da 'restrição'. Além disso, esse gráfico conterá uma transição de fase em que essa probabilidade aumenta rápida e drasticamente.
Os piores exemplos dos problemas de NP-completo estão nessa transição de fase.
O fato de haver um problema nessa transição de fase permanece invariável durante a transformação de um problema NP-completo em outro.

Este artigo foi publicado em 1991. Minha pergunta é: houve alguma pesquisa de acompanhamento sobre essas idéias nos últimos 25 anos? E se sim, qual é o pensamento atual sobre eles? Eles foram encontrados corretos, incorretos, irrelevantes?

np-hardness worst-case

— dimpol
fonte

Instâncias aleatórias de CSP, k-sat, k-colouring foram extensivamente estudadas pela comunidade do TCS. Por exemplo, o fato de que a densidade / 'restrição' na qual podemos resolver eficientemente um problema em particular é muitas vezes menor que o limite no qual a probabilidade de uma solução existente ir de 1 a 0, o que atraiu muita atenção.

— JWM

Em que probabilidade está o limiar de 'fácil solvabilidade' (grosso modo)? É mais como 0,2 ou mais como 0,001?

— dimpol

@dimpol geralmente não é definido um limite tão preciso. O ponto é em que "restrição" a probabilidade vai para 0 ou 1 com o tamanho da entrada. Uma declaração típica seria: "O algoritmo A resolve uma instância aleatória de 3-SAT com

variáveis e cláusulas

com probabilidade pelo menos

, onde

vai para 1 com

". O limite é o valor de

para o qual a probabilidade varia de tender para 0 e tender para 1. #

n

$n$

Δ n

$\Delta n$

p_{n}

$p_n$

p_{n}

$p_n$

n

$n$

Δ

$\Delta$

— Sasho Nikolov

acho que as idéias foram muito influentes em geral e há um conjunto muito grande de artigos relacionados a esse tópico e a pesquisa continua. no entanto, é um conceito transversal, porque as transições de fase provêm mais da física e (talvez os MATs respondam abaixo) talvez os cientistas da computação sejam um pouco mais céticos quanto ao seu significado, e também parece possivelmente mais um conceito empírico / experimental. pode tentar encontrar uma resposta em alguns pontos, se outros concordarem com este comentário, mas por enquanto convide / defnaria altamente incentivar uma discussão / análise mais aprofundada no bate

— vzn

veja também quão comum é a transição de fase nos problemas completos do NP . Também acho que Walsh 1998 a borda da faca de restrição é significativa e não foi acompanhada muito, está inter-relacionada ao ponto de transição, mas talvez não seja exatamente o mesmo conceito ... o artigo não menciona fractais diretamente, mas acha altamente sugestivo em sua referência a auto-similaridade, invariância de escala etc.

— vzn

Respostas:

Aqui está um resumo aproximado do status com base em uma apresentação feita por Vardi em um Workshop sobre teoria finita e algorítmica de modelos (2012):

Observou-se que instâncias difíceis estão na transição de fase da região sub-restrita para excessiva. A conjectura fundamental é que existe uma forte conexão entre transições de fase e complexidade computacional dos problemas de NP.

$P \ne NP$ $P$

O pensamento corrente atual parece ser (como afirmado por Vardi) que as transições de fase não estão intrinsecamente conectadas à complexidade computacional.

Finalmente, aqui está um artigo publicado na Nature que investiga a conexão entre transições de fase e dureza computacional do K-SAT.

— Mohammad Al-Turkistany
fonte

Obrigado pela visão geral, uma pena que isso não tenha levado a verdadeiras descobertas.

— dimpol

Penso que fenómenos devastadores podem ser considerados uma regra de algoritmos baseados em pesquisa local que são a base de muitos algoritmos heurísticos para problemas difíceis de NP.

— Kaveh

conversa / vídeo similar / um tanto revisado por Vardi, 2014, transições de fase e complexidade computacional , estação internacional de pesquisa de Banff

— vzn

@vzn Nice, deve assistir ao vídeo de Vardi.

— Mohammad Al-Turkistany

Sim, tem havido muito trabalho desde o trabalho de Cheeseman, Kanefsky e Taylor em 1991.

Fazer uma busca por revisões das transições de fase dos problemas do NP-Complete fornecerá muitos resultados. Uma dessas revisões é Hartmann e Weigt [1]. Para uma introdução de nível superior, consulte os artigos de Brian Hayes American Scientist [2] [3].

O artigo de Cheesemen, Kanefsky e Taylor, de 1991, é um caso infeliz de cientistas da computação que não prestam atenção à literatura matemática. No artigo de Cheeseman, Kanefsky e Taylor, eles identificaram o Ciclo Hamiltoniano como tendo uma transição de fase com um aumento no custo de pesquisa próximo ao limite crítico. O modelo de gráfico aleatório utilizado foi o gráfico aleatório Erdos-Renyi (probabilidade de borda fixa ou distribuição equivalente em graus gaussianos). Este caso foi bem estudado antes do artigo de Cheeseman et all, de 1991, com algoritmos de tempo polinomial conhecidos quase certos para essa classe de gráfico, mesmo no limiar crítico ou próximo dele. Os "Gráficos Aleatórios" de Bollobas [4] são uma boa referência. A prova original, acredito, foi apresentada por Angliun e Valiant [5], com outras melhorias de Bollobas, Fenner e Frieze [6]. Depois de Cheeseman,

A transição de fase para Ciclos Hamiltonianos em gráficos aleatórios Erdos-Renyi existe no sentido de que há uma transição rápida da probabilidade de encontrar uma solução, mas isso não se traduz em um aumento na complexidade "intrínseca" de encontrar Ciclos Hamiltonianos. Existem algoritmos de tempo polinomial quase certos para encontrar Ciclos Hamiltonianos em gráficos aleatórios Erdos-Renyi, mesmo na transição crítica, tanto na teoria quanto na prática.

A propagação da pesquisa [8] teve um bom sucesso em encontrar instâncias satisfatórias para o 3-SAT aleatório muito próximo do limite crítico. Meu conhecimento atual está um pouco enferrujado, então não tenho certeza se houve algum grande progresso em encontrar algoritmos "eficientes" para casos insatisfatórios perto do limite crítico. O 3-SAT, tanto quanto eu sei, é um dos casos em que é "fácil" resolver se é satisfatório e próximo ao limite crítico, mas desconhecido (ou difícil?) No caso insatisfatório próximo ao limite crítico.

Meu conhecimento está um pouco datado agora, mas a última vez que examinei esse assunto em profundidade, havia algumas coisas que se destacaram para mim:

O ciclo hamiltoniano é "fácil" para gráficos aleatórios Erdos-Renyi. Onde estão os problemas difíceis para isso?
A Partição de números deve ser solucionável quando estiver muito distante na região de probabilidade quase 0 ou 1, mas nenhum algoritmo eficiente (até onde eu saiba) exista para tamanhos de instância moderados (até 1000 números de 500 bits cada, é, até onde eu sei, completamente intratável com algoritmos de última geração). [9] [10]
O 3-SAT é "fácil" para instâncias satisfatórias próximas ao limite crítico, mesmo para tamanhos enormes de instâncias (milhões de variáveis), mas difícil para instâncias insatisfatórias próximas ao limite crítico.

Hesito em incluí-lo aqui, pois não publiquei nenhum artigo revisado por pares, mas escrevi minha tesesobre o assunto. A idéia principal é que uma possível classe de conjuntos aleatórios (ciclos hamiltonianos, problema de partição de números etc.) que são "intrinsecamente difíceis" são aqueles que possuem uma propriedade de "invariância de escala". Distribuições Levy-estáveis são uma das distribuições mais naturais com essa qualidade, com caudas nas leis de energia, e pode-se escolher instâncias aleatórias dos conjuntos NP-Complete que de alguma forma incorporam a distribuição Levy-estável. Eu dei algumas evidências fracas de que instâncias do Ciclo Hamiltoniano intrinsecamente difíceis podem ser encontradas se gráficos aleatórios forem escolhidos com uma distribuição de grau estável de Levy em vez de uma distribuição Normal (ou seja, Erdos-Renyi). Se nada mais, pelo menos, lhe dará um ponto de partida para alguma revisão da literatura.

[1] AK Hartmann e M. Weigt. Transições de fase em problemas de otimização combinatória: conceitos básicos, algoritmos e mecânica estatística. Wiley-VCH, 2005.

[2] B. Hayes. O problema mais fácil e difícil. American Scientist, 90 (2), 2002.

[3] B. Hayes. No limiar. American Scientist, 91 (1), 2003.

[4] B. Bollobás. Gráficos Aleatórios, Segunda Edição. Cambridge University Press, Nova Iorque, 2001.

[5] D. Angluin e LG Valiant. Algoritmos probabilísticos rápidos para circuitos e combinações de Hamilton. J. Computer, Syst. Sci., 18: 155-193, 1979.

[6] B. Bollobás, TI Fenner e AM Frieze. Um algoritmo para encontrar caminhos e ciclos de Hamilton em gráficos aleatórios. Combinatorica, 7: 327–341, 1987.

[7] B. Vandegriend e J. Culberson. A transição de fase Gn, m não é difícil para o problema do ciclo hamiltoniano. J. of AI Research, 9: 219-245, 1998.

[8] A. Braunstein, M. Mézard e R. Zecchina. Propagação de pesquisa: um algoritmo de satisfação. Random Structures and Algorithms, 27: 201–226, 2005.

[9] I. Gent e T. Walsh. Análise de heurísticas para particionamento de números. Computational Intelligence, 14: 430–451, 1998.

[10] CP Schnorr e M. Euchner. Redução da base de treliça: algoritmos práticos aprimorados e solução de problemas de soma de subconjuntos. Em Procedimentos de Fundamentos da Teoria da Computação '91, L. Budach, ed., Lecture Notes in Computer Science, volume 529, páginas 68-85, 1991.

— user834
fonte

25 anos de estudo e onde estão as idéias atuais:

+++ ideia 1:

Na minha experiência em resolução de satisfação, descobri na prática que adicionar uma cláusula k válida a uma fórmula que estamos tentando resolver é semelhante a decidir uma variável (nk) qbf.

Isso parece ser uma abordagem para mostrar que os métodos atuais de resolução de problemas por satélites são difíceis em termos de espaço!

+++ idéia 2:

Outra idéia é que o problema do AllQBFs é um problema real na hierarquia booleana. O problema do AllQBFs é: Produza uma expressão booleana Q que decida todos os 2 ^ n qbfs de uma fórmula R. AllQBFs é fácil quando a fórmula original R é monótona ou 2-cnf.

AllQBFs parece um caminho plausível para mostrar QBF é Exp, porque Q é frequentemente exponencial, portanto, avaliar uma atribuição de Q (uma quantificação da fórmula original R) é exponencial. Portanto, o caminho para provar a NP é Exp, pelo menos, tem alguns tijolos.

+++ idéia 3: k-cnfs regulares

Aliás, todos os estudos de transição de fase perderam os k-cnfs regulares, onde o número de ocorrências de uma variável (em qualquer direção) é fixo, semelhante aos gráficos regulares de graus ... Os k-cnfs regulares ficam muito mais difíceis do que o modelo padrão, porque todas as variáveis parecem idênticas em termos de restrições sobre elas.

Vinte e cinco anos atrás, logo após ler o Cheeseman, concentrei-me no grau de coloração gráfica regular, porque todas as variáveis parecem iguais. Então, abusarei do meu privilégio de resposta aqui e apresentarei vinte e cinco anos de resultados em gráficos regulares!

+++ idéia 4: Golden Points para estudos de benchmark de satisfação

Estudei extensivamente a coloração C dos gráficos regulares de vértices de N D. A tabela a seguir resume os resultados do Golden Point para colorir gráficos regularmente.

Para alta probabilidade, N instâncias aleatórias foram satisfatórias. Para Very High, N ^ 2 foram satisfatórios. Para Super High, N ^ 3 instâncias aleatórias foram satisfatórias.

Os pontos de coloração dourados da Alta Probabilidade (1 - 1 / N) são:

C3D5N180 C4D6N18 C4D7N35 C4D8N60 C4D9N180? C5D10N25 C5D11N42 C5D12N72

Os pontos de coloração dourados de Probabilidade Muito Alta (1 - 1 / (N ^ 2)) são:

C3D5N230? C4D6N18 C4D7N36 C4D8N68 C4D9N ??? C5D10N32 C5D11N50 C5D12N78

Os pontos de coloração dourados da Super Alta Probabilidade (1 - 1 / (N ^ 3)) são:

C3D5N ??? C4D6N22 C4D7N58 C4D8N72? C4D9N ??? C5D10N38 C5D11N58 C5D12N ??

A entrada C4D9 indica quatro cores dos gráficos do nono grau. Estes são os 4cnfs aleatórios mais difíceis que encontrei em 25 anos de resolução de problemas. Recentemente, pintei um gráfico do nono grau de 172 vértices após dez dias de tempo de CPU.

+++ Ideia 5: O C5D16N ???? Golden Point é levemente conjecturado para existir.

Obrigado, Daniel Pehoushek

— daniel pehoushek
fonte

Este não é o lugar certo para apresentar pesquisas não publicadas. Escreva um artigo explicando tudo em detalhes, coloque-o no arxiv ou em outro lugar e poste um link aqui com um resumo.

— Sasho Nikolov

O ponto de coloração regular do gráfico C4D9 é um ponto extremamente difícil, conforme o título da pergunta. Precisava de um pouco de contexto, assim o resto da mesa.

— Daniel pehoushek