Probabilidade de uma rede de classificação aleatória funcionar

Dado entradas , construímos uma rede de ordenação aleatória com portões por iterativamente colheita duas variáveis com e adicionando um portão comparador que eles se permutas . $n$ $x_0, \ldots, x_{n-1}$ $m$ $x_i, x_j$ $i < j$ $x_i > x_j$

Pergunta 1 : Para fixo , qual deve ser o tamanho da rede para classificar corretamente com probabilidade ? $n$ $m$ $> \frac{1}{2}$

Temos pelo menos o limite inferior $m = \Omega(n^2 \log n)$ pois uma entrada que é classificada corretamente, exceto que cada par consecutivo é trocado, levará tempo $\Theta(n^2 \log n^2)$ para cada par a ser escolhido como comparador. Esse também é o limite superior, possivelmente com mais $\log n$ fatores?

Pergunta 2 : Existe uma distribuição de portas do comparador que atinge $m = \tilde{O}(n)$ , talvez escolhendo comparadores próximos com maior probabilidade?

sorting-network

— Geoffrey Irving
fonte

Eu acho que alguém pode obter um limite superior de

O (n^{3} l o g^{O (1)})

$O(n^3log^{O(1)})$ olhando uma entrada de cada vez e depois delimitando a união, mas isso parece longe de ser apertado.

— Daniello #

Idéia para a pergunta 2: escolha uma rede de classificação de profundidade

O (\log^{2} n)

$O(\log^2 n)$ . Em cada etapa, escolha aleatoriamente um dos portões da rede de classificação e faça essa comparação. Após

\tilde{O} (n)

$\tilde{O}(n)$ etapas, todos os portões na primeira camada serão aplicados. Após outras etapas

\tilde{O} (n)

$\tilde{O}(n)$ , todos os portões na segunda camada serão aplicados. Se você puder mostrar que isso é monotônico (inserir comparações extras no meio da rede de classificação não pode prejudicar), você obteve uma solução com comparadores

\tilde{O} (n)

$\tilde{O}(n)$ no total, em média. Não tenho certeza se a monoticidade realmente é válida.

— DW

@ DW: A monotonicidade não é necessariamente válida. Considere as seqüências sequência funciona;

não (considere a entrada (1, 0, 0)). A idéia é que

classifique qualquer entrada que receba, exceto

(veja aqui ). Em

, essa entrada não pode alcançar

. Em

pode.

\begin{array}{rcl} s & = & (x_{1}, x_{2}), (x_{0}, x_{2}), (x_{0}, x_{1}); \\ s^{'} & = & (x_{1}, x_{2}), (x_{0}, x_{1}), (x_{0}, x_{2}), (x_{0}, x_{1}) . \end{array}

$\begin{eqnarray*} s &=&(x_1, x_2), (x_0, x_2), (x_0, x_1);\\ s'&=&(x_1, x_2), \mathbf{(x_0, x_1)}, (x_0, x_2), (x_0, x_1).\end{eqnarray*}$

s

$s$

s^{'}

$s'$

(x_{0}, x_{2}), (x_{0}, x_{1})

$(x_0, x_2), (x_0, x_1)$

(0, 1, 0)

$(0, 1, 0)$

s

$s$

(x_{0}, x_{2}), (x_{0}, x_{1})

$(x_0, x_2), (x_0, x_1)$

s^{'}

$s'$

— Neal Young

Considere a variante em que a rede é escolhida escolhendo duas variáveis adjacentes aleatoriamente em cada etapa. Agora a monotonicidade se mantém (como swaps adjacentes não criam inversões). Aplique a idéia de @ DW a uma rede de classificação ímpar-par , que possui rodadas: em rodadas ímpares, ele compara todos os pares adjacentes onde é ímpar; nas rodadas pares, ele compara todos os pares adjacentes onde é par. Quando a rede aleatória está correta nas comparações , pois "inclui" esta rede. (Ou estou faltando alguma coisa?)

x_{i}, x_{i + 1}

$x_i, x_{i+1}$

n

$n$

i

$i$

i

$i$

O (n^{2} \log n)

$O(n^2\log n)$

— Neal Young

Monotonicidade de redes adjacentes: Dado , para defina . Diga se ( ). Corrija qualquer comparação " ". Deixe- e vêm de e fazendo essa comparação. Reivindicação 1. e . Reivindicação 2: se , então . Então mostre indutivamente: se

a, b \in {0, 1}^{n}

$a, b\in\{0,1\}^n$

j \in {0, 1, \dots, n}

$j\in\{0,1,\ldots,n\}$

s_{j} (a) = \sum_{i = 1}^{j} a_{i}

$s_j(a) = \sum_{i=1}^j a_i$

a ⪯ b

$a\preceq b$

s_{j} (a) \leq s_{j} (b)

$s_j(a) \le s_j(b)$

\forall j

$\forall j$

x_{i} < x_{i + 1}

$x_i < x_{i+1}$

a^{'}

$a'$

b^{'}

$b'$

a

$a$

b

$b$ $a' \preceq a$ $b' \preceq b$ $a\preceq b$ $a' \preceq b'$

y

$y$ é o resultado da sequência de comparação na entrada , e é o resultado da super-sequência de em , então . Portanto, se é classificado, o mesmo é .

s

$s$

x

$x$

y^{'}

$y'$

s^{'}

$s'$

s

$s$

x

$x$

y^{'} ⪯ y

$y' \preceq y$

y

$y$

y^{'}

$y'$

— Neal Young

Aqui estão alguns dados empíricos para a pergunta 2, com base na ideia de DW aplicada à classificação bitônica. Para variáveis, escolha com probabilidade proporcional a , depois selecione uniformemente aleatoriamente para obter um comparador . Isso corresponde à distribuição dos comparadores em classificação bitônica se for uma potência de 2 e, caso contrário, será aproximada. $n$ $j - i = 2^k$ $\lg n - k$ $i$ $(i,j)$ $n$

Para uma determinada sequência infinita de portas extraídas dessa distribuição, podemos aproximar o número de portas necessárias para obter uma rede de classificação, classificando muitas seqüências aleatórias de bits. Aqui está a estimativa para tendo a média de mais de sequências de gate com sequências de bits usadas para aproximar a contagem: parece corresponder a , a mesma complexidade que a classificação bitônica. Nesse caso, não comemos um fator extra devido ao problema do coletor de cupons de encontrar cada porta. $n < 200$ $100$ $6400$ $\Theta(n \log^2 n)$ $\log n$

Para enfatizar: estou usando apenas seqüências de bits para aproximar o número esperado de portas, não . As portas médias necessárias aumentam com esse número: para se eu usar as seqüências , e , as estimativas são , e . Assim, é possível que as últimas seqüências aumentem a complexidade assintótica, embora, intuitivamente, pareça improvável. $6400$ $2^n$ $n = 199$ $6400$ $64000$ $640000$ $14270 \pm 1069$ $14353 \pm 1013$ $14539 \pm 965$

Edit : Aqui está um gráfico semelhante até , mas usando o número exato de portas (calculado através de uma combinação de amostragem e Z3). Eu mudei da potência de dois para arbitrário com probabilidade proporcional a . ainda parece plausível. $n = 80$ $d = j-i$ $d \in [1,\frac{n}{2}]$ $\frac{\log n - \log d}{d}$ $\Theta(n \log^2 n)$

— Geoffrey Irving
fonte

Boa experiência! Existe uma maneira diferente de o problema do coletor de cupons aparecer aqui: você está apenas amostrando uma pequena fração das seqüências de bits necessárias para verificar a correção em todas as entradas. Parece que podemos concluir (cientificamente, não matematicamente, é claro) a partir de seu experimento que uma rede aleatória desse tipo e tamanho classifica uma permutação aleatória whp. Eu também ficaria curioso para ver testes exaustivos de nessas redes aleatórias para todos os até os quais você está disposto a ir. ( não deve ser tão ruim, talvez até dependendo do idioma e hardware que você está usando).

2^{n}

$2^n$

2^{n}

$2^n$

n

$n$

n = 20

$n=20$

n = 30

$n=30$

— Joshua Grochow

Parece o mesmo para exatos até , mas não vejo isso como conclusivo.

n = 27

$n = 27$

— Geoffrey Irving

@ JoshuaGrochow: Adicionei valores exatos até

n = 80

$n = 80$

— Geoffrey Irving

Agradável! Parece haver uma propagação crescente para os dados exatos, o que talvez indica um limite superior com um fator extra de

? (Isto é, se o "spread" está crescendo a uma taxa de

\log n

$\log n$

\log n

$\log n$

— Joshua Grochow

Sim, não podemos descartar um fator extra. Eu ficaria surpreso se fosse

, no entanto, uma vez que em 80 temos

e a constante é suspeitamente próxima de caso contrário. Nesse ponto, acho que a teoria precisa assumir o controle. :)

\log n

$\log n$

\lg n \approx 6

$\lg n \approx 6$

1

$1$

— Geoffrey Irving