Por que Radix Sort ?

23

Na classificação radix, classificamos primeiro pelo dígito menos significativo, depois classificamos pelo segundo dígito menos significativo e assim por diante e terminamos com a lista classificada.

Agora, se temos lista de números que precisamos bits para distinguir entre aqueles número. Portanto, o número de passes de classificação de radix que fazemos será . Cada passagem leva tempo e, portanto, o tempo de execução da classificação de raiz é $n$ $\log n$ $\log n$ $O(n)$ $O(n \log n)$

Mas é sabido que é um algoritmo de tempo linear. Por quê?

algorithms sorting

— Pratik Deoghare
fonte

É por isso que as ordenações lineares do tempo geralmente exigem que a entrada seja um número inteiro em algum intervalo fixo. A classificação Radix requer um intervalo fixo nos dígitos. No seu exemplo, você assumiu que o intervalo era , mas qualquer intervalo inteiro é possível para os dígitos; por exemplo, você poderia ter escolhido

[0, 1]

$[0,1]$

[0, \sqrt{n}]

$[0, \sqrt{n}]$

— Joe

19

se tivermos uma lista de números, precisamos bits $n$ $\log n$

Não: se tivermos uma lista de números entre e , precisaremos de bits. Não há relacionamento entre e em geral. $0$ $2^k - 1$ $k$ $k$ $\log n$

Se os números forem todos distintos, então , e a classificação do radical em números distintos, portanto, possui uma complexidade de tempo de . Em geral, a complexidade da classificação do radical é $\log n \ge k$ $\Omega(n \log n)$ onde é o número de elementos a serem classificados e é o número de bits em cada elemento. $\Theta(n \, k)$ $n$ $k$

Dizer que a complexidade da classificação de raiz é significa assumir um tamanho de bit fixo para os números. Isso implica que, para grande o suficiente , haverá muitos valores duplicados. $O(n)$ $n$

Existe um teorema geral de que um método de classificação de matriz ou lista que funciona comparando dois elementos por vez não pode ser executado mais rapidamente que na pior das hipóteses. A classificação Radix não funciona comparando elementos, mas o mesmo método de prova funciona. A classificação Radix é um processo de decisão para determinar qual permutação aplicar à matriz; existem permutações da matriz e a classificação de radix toma decisões binárias, isto é, decide se deve trocar dois elementos ou não em cada estágio. Depois decisões binárias, radix sort pode decidir entre permutações. Para alcançar o possíveis permutações, é necessário que $\Theta(n \log n)$ $n!$ $m$ $2^m$ $n!$ . $m \ge \log (n!) = \Theta(n \log n)$

Uma suposição na prova de que não escrevi acima é que o algoritmo deve funcionar no caso em que os elementos são distintos. Se se sabe a priori que os elementos não são todos distintos, então o número de permutações potenciais é menor que o valor . Ao classificar números de bits de , só é possível ter elementos distintos quando ; nesse caso, a complexidade da classificação do radical é de fato . Para valores maiores de , deve haver colisões, o que explica como a classificação de raiz pode ter uma complexidade menor que $n!$ $k$ $n$ $n \le 2^k$ $\Omega(n \log n)$ $n$ quando . $\Theta(n \log n)$ $n \gt 2^k$

— Gilles 'SO- parar de ser mau'
fonte

1

Um ponto de vista alternativo é o do modelo de custo da palavra RAM: Nossa máquina pode trabalhar com números inteiros de

bits em tempo constante. (Máquinas atuais com

) Dessa forma, uma etapa de classificação da distribuição com baldes de

pode ser realizada no tempo

acessando diretamente um elemento de matriz correspondente. Dessa forma, a classificação do radical é linear para

números inteiros de

bits cada.

w

$w$

w = 64

$w=64$

2^{w}

$2^w$

O (1)

$O(1)$

n

$n$

w = O (\log n)

$w=O(\log n)$

— 23314 Sebastian

9

Tenha cuidado com sua análise: o que você supõe para executar a classificação em tempo? Isso ocorre porque cada um dos seus dígitos está no intervalo de a , o que significa que seus dígitos podem assumir valores possíveis. Você precisa de um algoritmo de classificação estável, para poder, por exemplo, escolher a classificação de contagem. A classificação da contagem é executada em . Se , a classificação da contagem é executada em tempo linear. $O(n)$ $0$ $k-1$ $k$ $\Theta(n+k)$ $k=O(n)$

Cada uma de suas seqüências ou números tem dígitos. Como você diz, você faz passar por cima deles. Portanto, a classificação de raiz é executada claramente em . Mas se considerarmos que é constante e , vemos que a classificação do radical é executada em tempo linear. $d$ $d$ $\Theta(d(n+k))$ $d$ $k=O(n)$

— Juho
fonte

1

Por exemplo, suponha que você esteja classificando números inteiros no intervalo

para alguns

para a constante

. Então você pode ter

dígitos, cada um com o intervalo

.

[0, N - 1]

$[0, N-1]$

N = O (n^{d})

$N = O(n^d)$

d

$d$

O (d)

$O(d)$

O (n)

$O(n)$

— 11113 Joe

-2

Eu acho que a suposição está errada. Você pode executar a classificação radix com números, por exemplo, hexadecimal. Assim, em cada etapa, você divide seu conjunto de números em blocos. $k = \log_2(n)$ $16$

— Alexandre Kandalintsev
fonte

6

No que diz respeito ao big-O, não há diferença entre o

e o

.

\log_{2} n

$\log_2n$

\log_{16} n

$\log_{16}n$

— Rick Decker