Recentemente, aprendi sobre a conjectura gananciosa do menor problema das supercordas .
Nesse problema, recebemos um conjunto de seqüências de caracteres e queremos encontrar as menores supercordas ou seja, tais que cada apareça como uma subcadeia de .
Esse problema é difícil para NP e, após uma longa sequência de trabalhos, o algoritmo de aproximação mais conhecido para esse problema possui uma proporção [Paluch '14].
Na prática, os biólogos usam o seguinte algoritmo Greedy:
Em cada etapa, mescle duas cadeias que tenham sobreposição máxima em todos os pares (o sufixo máximo que é o prefixo de outra cadeia) e repita nesta nova instância até que exista apenas uma cadeia (que é uma supercadeia de todas as cadeias de entrada) )
Um limite inferior de na razão de aproximação deste algoritmo ganancioso pode ser obtido a partir da entrada .
Curiosamente, foi conjeturado que este é o pior exemplo, ou seja, que Greedy alcança uma aproximação para o menor problema de supercorda. Fiquei muito surpreso ao ver que um algoritmo tão natural e fácil é tão difícil de analisar.
Existem intuições, fatos, observações, exemplos que sugerem por que essa pergunta é tão desafiadora?