Perguntas com a marcação «html-parsing»



9
Analisar uma string HTML com JS
Eu procurei uma solução, mas nada era relevante, então aqui está o meu problema: Eu quero analisar uma string que contém texto HTML. Eu quero fazer isso em JavaScript. Eu tentei esta biblioteca, mas parece que ela analisa o HTML da minha página atual, não de uma string. Porque quando …

18
Usando expressões regulares para analisar HTML: por que não?
Parece que todas as perguntas no stackoverflow em que o solicitante está usando o regex para obter algumas informações do HTML terão inevitavelmente uma "resposta" que diz para não usar o regex para analisar o HTML. Por que não? Estou ciente de que existem analisadores HTML "reais" entre aspas, como …

3
Qual analisador de HTML é o melhor? [fechadas]
Atualmente, essa questão não se encaixa no nosso formato de perguntas e respostas. Esperamos que as respostas sejam apoiadas por fatos, referências ou conhecimentos, mas essa pergunta provavelmente solicitará debate, argumentos, pesquisas ou discussão prolongada. Se você acha que essa pergunta pode ser melhorada e possivelmente reaberta, visite o centro …

7
Analisando HTML usando Python
Estou procurando um módulo Parser HTML para Python que possa me ajudar a obter as tags na forma de listas / dicionários / objetos em Python. Se eu tiver um documento do formulário: <html> <head>Heading</head> <body attr1='val1'> <div class='container'> <div id='class'>Something here</div> <div>Something else</div> </div> </body> </html> então, ele deve …



5
Como analiso uma página HTML com Node.js
Eu preciso analisar (lado do servidor) grandes quantidades de páginas HTML. Todos concordamos que regexp não é a melhor opção aqui. Parece-me que o javascript é a maneira nativa de analisar uma página HTML, mas essa suposição se baseia no código do lado do servidor com toda a capacidade DOM …

8
Como extrair string seguindo um padrão com grep, regex ou perl
Eu tenho um arquivo parecido com este: <table name="content_analyzer" primary-key="id"> <type="global" /> </table> <table name="content_analyzer2" primary-key="id"> <type="global" /> </table> <table name="content_analyzer_items" primary-key="id"> <type="global" /> </table> Preciso extrair qualquer coisa entre as aspas a seguir name=, ou seja content_analyzer, content_analyzer2e content_analyzer_items. Estou fazendo isso em uma máquina Linux, então uma solução …
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.