Eu preciso analisar (lado do servidor) grandes quantidades de páginas HTML.
Todos concordamos que regexp não é a melhor opção aqui.
Parece-me que o javascript é a maneira nativa de analisar uma página HTML, mas essa suposição se baseia no código do lado do servidor com toda a capacidade DOM que o javascript tem dentro de um navegador.
O Node.js tem essa capacidade embutida?
Existe uma abordagem melhor para esse problema, analisando HTML no lado do servidor?