Gerando entradas para algoritmos gráficos de teste aleatório?

Ao testar algoritmos, uma abordagem comum é o teste aleatório: gere um número significativo de entradas de acordo com alguma distribuição (geralmente uniforme), execute o algoritmo nelas e verifique a correção. As estruturas de teste modernas podem gerar entradas automaticamente, dada a assinatura dos algoritmos, com algumas restrições.

Se as entradas são números, listas ou seqüências de caracteres, gerando essas entradas diretamente. As árvores são mais difíceis, mas ainda fáceis (usando gramáticas estocásticas sem contexto ou abordagens semelhantes).

Como você pode gerar gráficos aleatórios (eficientemente)? Normalmente, escolher gráficos uniformemente aleatoriamente não é o que você deseja: eles devem estar conectados, planares ou sem ciclo, ou preencher qualquer outra propriedade. A amostragem por rejeição parece subótima, devido ao conjunto potencialmente enorme de gráficos indesejáveis.

Quais são as distribuições úteis para analisar? Útil aqui significa que

é provável que os gráficos testem bem o algoritmo em questão e
eles podem ser gerados de forma eficaz e eficiente.

Eu sei que existem muitos modelos para gráficos aleatórios, então eu apreciaria algumas dicas sobre quais são melhores para a geração de gráficos nesse sentido.

Se "algum algoritmo" for muito geral, use algoritmos de localização de caminho mais curto como uma classe concreta de algoritmos em teste. Os gráficos para teste devem ser conectados e bastante densos (com alta probabilidade ou pelo menos em expectativa). Para o teste, a solução ideal seria criar gráficos aleatórios em torno de um caminho mais curto para que possamos saber o resultado desejado (sem ter que empregar outro algoritmo).

— Rafael
fonte

Essa pergunta foi desencadeada por essa .

— Raphael

Gráficos aleatórios com topologia de mundo pequeno

Em gráficos com topologia mundial pequena , os nós são altamente agrupados, mas o comprimento do caminho entre eles é pequeno. Uma topologia como essa pode dificultar os problemas de pesquisa, pois as decisões locais se propagam rapidamente em todo o mundo. Em outras palavras, os atalhos podem enganar heurísticas. Além disso, foi demonstrado que muitos problemas de pesquisa diferentes têm uma pequena topologia mundial.

Watts e Strogatz [1] propõem um modelo para pequenos gráficos mundiais . Primeiro, começamos com um gráfico regular. A desordem é introduzida no gráfico religando aleatoriamente cada aresta com probabilidade . Se , o gráfico é completamente regular e ordenado. Se , o gráfico é completamente aleatório e desordenado. Valores de produzem gráficos que não são completamente regulares nem completamente desordenados. Os gráficos não têm um pequeno topologia mundo para e . $p$ $p=0$ $p=1$ $0 < p < 1$ $p=0$ $p=1$

Watts e Strogatz começar a partir de uma estrutura de anel com nodos e vizinhos mais próximos. Um nó é escolhido da rede uniformemente aleatoriamente e uma borda reconectada é reconectada a ele. Se a religação criar uma aresta duplicada, ela permanecerá intocada. Para gráficos grandes e esparsos, eles exigem , onde garante que o gráfico permaneça conectado. $n$ $k$ $n \gg k \gg \ln(n) \gg 1$ $k \gg \ln(n)$

O modelo de Watts e Strogatz é um pouco popular, mas tem algumas desvantagens. Walsh [2] investiga os efeitos da randomização e estratégias de reinicialização em gráficos gerados usando o modelo. Há também um artigo de Virtanen [3], que aborda outros modelos motivados pela necessidade de modelagem realista de sistemas complexos.

Gráficos planares aleatórios simples

A geração de gráficos planares simples aleatórios em vértices uniformemente aleatórios pode ser feita com eficiência. O número de gráficos planares com vértices, , pode ser determinado usando funções geradoras. O valor de para é e , respectivamente. Como os números são muito complicados, não se espera encontrar uma fórmula fechada para eles. Giménez e Noy [4] fornecem uma estimativa assintótica precisa para o crescimento de : onde e $n$ $n$ $g_n$ $g_n$ $1 \leq n \leq 9$ $1,2,8,64,1023,32071,1823707,163947848$ $20402420291$ $g_n$

g_{n} \sim g \cdot n^{- 7 / 2} γ^{n} n!,

$g_n \sim g \cdot n^{-7/2} \gamma^n n!,$

g

$g$

γ

$\gamma$ são constantes determinadas analiticamente com valores aproximados e .

g \approx 0.42609

$g \approx 0.42609$

γ \approx 27.22687

$\gamma \approx 27.22687$

A prova do resultado leva a um algoritmo muito eficiente de Fusy [5]. Fusy fornece um gerador aleatório de tamanho aproximado e também um gerador aleatório de tamanho exato de gráficos planares. O algoritmo de tamanho aproximado é executado em tempo linear, enquanto o algoritmo de tamanho exato é executado em tempo quadrático. Os algoritmos são baseados na decomposição de acordo com níveis sucessivos de conectividade: árvore binária do gráfico planar conectado 2-conectado 3-conectado . $\rightarrow$ $\rightarrow$ $\rightarrow$ $\rightarrow$

Os algoritmos operam convertendo uma decomposição de um gráfico plano em um gerador aleatório usando a estrutura dos amostradores de Boltzmann por Duchon, Flajolet, Louchard e Schaeffer [6]. Dada uma classe combinatória, um amostrador Boltzmann desenha um objeto de tamanho com probabilidade para , onde é certo parâmetro real ajustado pelo usuário. Além disso, a distribuição de probabilidade está espalhada por todos os objetos da classe, com a propriedade de que objetos do mesmo tamanho têm a mesma probabilidade de ocorrer. Além disso, a distribuição de probabilidade é uniforme quando restrita a um tamanho fixo. $n$ $x^n$ $x$