Prova de que uma árvore de pesquisa binária construída aleatoriamente tem altura logarítmica

Como você prova que a altura esperada de uma árvore de pesquisa binária criada aleatoriamente com nós é ? Há uma prova no CLRS Introduction to Algorithms (capítulo 12.4), mas eu não entendo. $n$ $O(\log n)$

— user1675999
fonte

Qual questão? Que exemplo? Edite e forneça detalhes completos.

— Ran G.

Evite usar abreviações (como BST) e assuma que a maioria de nós não possui o livro do CLRS. Se você puder copiar o teorema aqui e explicar o que é que você não entende, obterá mais respostas.

— Ran G.

Isso vai depender de como a árvore de pesquisa binária é construída. (Mesmo que o resultado não aconteça, a prova o fará.) Mais alguns detalhes seriam úteis.

— quer

Vamos primeiro pensar sobre isso intuitivamente. No melhor cenário, a árvore está perfeitamente equilibrada; no pior cenário, a árvore está totalmente desequilibrada:

Árvore de pesquisa binária com altura equilibrada Árvore de pesquisa binária de pior caso

Começando no nó raiz , essa árvore esquerda tem o dobro de nós em cada profundidade subsequente, de forma que a árvore tenha nós e uma altura (que é neste caso 3). Com um pouco de matemática, , ou seja, tem altura. Para a árvore totalmente desequilibrada, a altura da árvore é simplesmente . Então, nós temos nossos limites. $p$ $n=\sum_{i=0}^{h}2^i =2^{h+1}-1$ $h$ $n\le2^{h+1}-1\rightarrow h\le\lceil\log_2(n+1)-1\rceil\le\lfloor log_2 n\rfloor$ $O(\log n)$ $n-1\rightarrow O(n)$

Se estivéssemos construindo uma árvore balanceada a partir de uma lista ordenada , escolheríamos o elemento do meio como nosso nó raiz. Se estivermos construindo uma árvore aleatoriamente, é provável que qualquer um dos nós seja escolhido e a altura da nossa árvore seja: Sabemos que em uma árvore de pesquisa binária, a subárvore esquerda deve conter apenas chaves menores que o nó raiz. Portanto, se escolhermos aleatoriamente o elemento , a subárvore esquerda possui elementos e a subárvore direita possui elementos, de forma mais compacta: $\{ 1,2,\dots,n\}$ $n$

h e i g h t_{t r e e} = 1 + max (h e i g h t_{l e f t s u b t r e e}, h e i g h t_{r i g h t s u b t r e e})

$height_{tree}=1+\max (height_{left\space subtree}, height_{right\space subtree})$

i^{t h}

$i^{th}$

i - 1

$i-1$

n - i

$n-i$

h_{n} = 1 + max (h_{i - 1}, h_{n - i})

$h_n=1+\max (h_{i-1},h_{n-i})$ . A partir daí, faz sentido que, se cada elemento tiver a mesma probabilidade de ser escolhido, o valor esperado seja apenas a média de todos os casos (em vez de uma média ponderada). Portanto:

E [h_{n}] = \frac{1}{n} \sum_{i = 1}^{n} [1 + max (h_{i - 1}, h_{n - i})]

$\operatorname{E}[h_n]=\frac{1}{n}\sum_{i=1}^{n}[1+\max (h_{i-1},h_{n-i})]$

Como tenho certeza de que você notou, desviei um pouco de como o CLRS prova isso, porque o CLRS usa duas técnicas de prova relativamente comuns que são desconcertantes para os não iniciados. O primeiro é usar expoentes (ou logaritmos) do que queremos encontrar (neste caso, altura), o que torna a matemática um pouco mais limpa; o segundo é usar funções indicadoras (que vou ignorar aqui). O CLRS define a altura exponencial como , portanto a recorrência análoga é . $Y_n=2^{h_n}$ $Y_n=2\times\max (Y_{i-1},Y_{n-i})$

Supondo que a independência (que cada desenho de um elemento (dentre os elementos disponíveis) seja a raiz de uma subárvore seja independente de todos os desenhos anteriores), ainda temos a relação: para o qual realizei duas etapas: (1) movendo o fora porque é uma constante e uma das propriedades das somas é que , e (2) movendo o 2 para fora porque também é uma constante e uma das propriedades dos valores esperados é . Agora vamos substituir o

E [Y_{n}] = \sum_{i = 1}^{n} \frac{1}{n} E [2 \times max (Y_{i - 1}, Y_{n - i})] = \frac{2}{n} \sum_{i = 1}^{n} E [max (Y_{i - 1}, Y_{n - i})]

$\operatorname{E}[Y_n]=\sum_{i=1}^{n}\frac{1}{n}\operatorname{E}[2\times\max (Y_{i-1},Y_{n-i})]=\frac{2}{n}\sum_{i=1}^{n}\operatorname{E}[\max (Y_{i-1},Y_{n-i})]$

\frac{1}{n}

$\frac{1}{n}$

\sum_{i} c i = c \sum_{i} i

$\sum_i ci=c\sum_i i$

E [a x] = a E [x]

$\operatorname{E}[ax]=a\operatorname{E}[x]$

max

$\max$ funcionar com algo maior, porque de outra forma simplificar é difícil. Se argumentarmos por não negativo , : , então: modo que o último passo decorra da observação de que para , e e indo todo o caminho para , e , portanto, cada termo

X

$X$

Y

$Y$

E [max (X, Y)] \leq E [max (X, Y) + min (X, Y)] = E [X] + E [Y]

$\operatorname{E}[\max(X,Y)]\le\operatorname{E}[\max(X,Y)+\min(X,Y)]=\operatorname{E}[X]+\operatorname{E}[Y]$

E [Y_{n}] \leq \frac{2}{n} \sum_{i = 1}^{n} (E [Y_{i - 1}] + E [Y_{n - i}]) = \frac{2}{n} \sum_{i = 0}^{n - 1} 2 E [Y_{i}]

$\operatorname{E}[Y_n]\le\frac{2}{n}\sum_{i=1}^{n}(\operatorname{E}[Y_{i-1}]+\operatorname{E}[Y_{n-i}])=\frac{2}{n}\sum_{i=0}^{n-1}2\operatorname{E}[Y_{i}]$

i = 1

$i=1$

Y_{i - 1} = Y_{0}

$Y_{i-1}=Y_{0}$

Y_{n - i} = Y_{n - 1}

$Y_{n-i}=Y_{n-1}$

i = n

$i=n$

Y_{i - 1} = Y_{n - 1}

$Y_{i-1}=Y_{n-1}$

Y_{n - i} = Y_{0}

$Y_{n-i}=Y_{0}$

Y_{0}

$Y_0$ para aparece duas vezes, para que possamos substituir o somatório inteiro por um análogo. A boa notícia é que temos um nome de repetição ; a má notícia é que não estamos muito mais longe do que começamos.

Y_{n - 1}

$Y_{n-1}$

E [Y_{n}] \leq \frac{4}{n} \sum_{i = 0}^{n - 1} E [Y_{i}]

$\operatorname{E}[Y_n]\le\frac{4}{n}\sum_{i=0}^{n-1}\operatorname{E}[Y_{i}]$

Neste ponto, o CLRS extrai um nome de operação prova de indução de seu ... repertório de experiência matemática, um que inclui uma identidade eles deixam para o usuário provar. O que é importante sobre a escolha deles é que seu maior termo é e lembre-se de que estamos usando a altura exponencial que . Talvez alguém comente por que esse binômio em particular foi escolhido. A idéia geral, porém, é ligar acima de nossa recorrência com uma expressão para alguma constante . $\operatorname{E}[Y_n]\le\frac{1}{4}\binom{n+3}{3}$ $\sum_{i=0}^{n-1}\binom{i+3}{3}=\binom{n+3}{4}$ $n^3$ $Y_n=2^{h_n}$ $h_n=\log_2n^3=3\log_2n\rightarrow O(\log n)$ $n^k$ $k$

Para concluir com um liner:

2^{E [X_{n}]} \leq E [Y_{n}] \leq \frac{4}{n} \sum_{i = 0}^{n - 1} E [Y_{i}] \leq \frac{1}{4} (\binom{n + 3}{3}) = \frac{(n + 3) (n + 2) (n + 1)}{24} \to E [h_{n}] = O (\log n)

$2^{\operatorname{E}[X_n]}\le \operatorname{E}[Y_n]\le \frac{4}{n}\sum_{i=0}^{n-1}\operatorname{E}[Y_i]\le\frac{1}{4}\binom{n+3}{3}=\frac{(n+3)(n+2)(n+1)}{24}\rightarrow \operatorname{E}[h_n]=O(\log n)$

— Merbs
fonte

WOW.Obrigado !!!! Mesmo que eu não saiba sobre o valor esperado, isso meio que faz sentido. Eu não fiz um curso discreto de matemática antes de fazer algoritmos. Vou postar mais comentários, se tiver alguma dúvida. Obrigado Merbs.

— user1675999

mas por que exatamente a altura exponencial é menor ou igual ao binômio escolhido? Ainda não entendo por que não podemos escolher outro binômio com o maior termo diferente e fazer exatamente a mesma matemática ... provavelmente sou burra, mas não consigo entender o porquê ... e até o momento faz todo o sentido, então eles apenas tiveram que puxar algo completamente do nada e, sem explicação, nos dizem que "prova" que eles estão certos ...

— Zeks

@ Zeks Então, podemos escolher outros binômios com termos maiores. Se o termo ainda for polinomial ( n^k), a conclusão é a mesma, porque a kletra é descartada na notação big-O (a maneira como 3 foi descartada). Mas se substituíssemos por algo exponencial ( e^n), ainda seria um limite superior correto , mas não restrito . Sabemos que a altura esperada é pelo menos logarítmica, portanto, determinar se é no máximo logarítmica torna-a mais estreita.

— Merbs

@DavidNathan Eu não entendo sua preocupação - você está duvidando que 1 / n seja uma constante ou que possa ser movido para fora do somatório? Como a constante 2, é amplamente retirada para fins ilustrativos, para simplificar a prova restante.

— Merbs