Uma das principais falhas curl
é que cada vez mais páginas da web estão tendo seu conteúdo principal pintado por uma resposta AJAX JavaScript que ocorre após a resposta HTTP inicial. curl
nunca capta esse conteúdo pós-pintado.
Portanto, para buscar esses tipos de páginas da Web na linha de comando, fui reduzido a escrever scripts em Ruby que levam o SeleniumRC a iniciar uma instância do Firefox e, em seguida, retornar o HTML de origem após a conclusão dessas chamadas AJAX.
Seria muito melhor ter uma solução de linha de comando mais enxuta para esse tipo de problema. Alguém sabe de algum?