Você está incorreto ao saber que o HMC não é um método da cadeia de Markov. Por Wikipedia :
Em matemática e física, o algoritmo híbrido de Monte Carlo, também conhecido como Hamiltoniano Monte Carlo, é um método de Monte Carlo da cadeia de Markov para obter uma sequência de amostras aleatórias a partir de uma distribuição de probabilidade para a qual a amostragem direta é difícil. Essa sequência pode ser usada para aproximar a distribuição (ou seja, para gerar um histograma) ou para calcular uma integral (como um valor esperado).
Para maior clareza, leia o artigo arXiv de Betancourt , que menciona os critérios finais da NUTS:
... identificar quando uma trajetória é longa o suficiente para gerar uma exploração suficiente da vizinhança em torno do atual nível de energia definido. Em particular, queremos evitar a integração muito curta, caso em que não tiraríamos o máximo proveito das trajetórias hamiltonianas e a integração por muito tempo, caso em que desperdiçamos recursos computacionais preciosos na exploração que produz apenas retornos decrescentes.
O Apêndice A.3 fala sobre algo como a trajetória dobrada que você menciona:
Também podemos expandir mais rapidamente dobrando o comprimento da trajetória a cada iteração, produzindo uma trajetória amostrada t ∼ T (t | z) = U T2L com o estado amostrado correspondente z ′ ∼ T (z ′ | t). Nesse caso, os componentes antigos e novos da trajetória a cada iteração são equivalentes às folhas das árvores binárias perfeitas e ordenadas (Figura 37). Isso nos permite construir recursivamente os novos componentes da trajetória, propagando uma amostra a cada etapa da recursão ...
e expande isso em A.4, onde fala sobre uma implementação dinâmica (a seção A.3 fala sobre uma implementação estática):
Felizmente, os esquemas estáticos eficientes discutidos na Seção A.3 podem ser iterados para obter uma implementação dinâmica, uma vez que escolhemos um critério para determinar quando uma trajetória cresceu o suficiente para explorar satisfatoriamente o conjunto de níveis de energia correspondente.
Eu acho que a chave é que ele não faz saltos que dobram, calcula seu próximo salto usando uma técnica que dobra o comprimento do salto proposto até que um critério seja atendido. Pelo menos é assim que eu entendo o artigo até agora.