Perguntas com a marcação «html-content-extraction»



8
Extrair parte de uma correspondência de regex
Eu quero uma expressão regular para extrair o título de uma página HTML. Atualmente eu tenho isso: title = re.search('<title>.*</title>', html, re.IGNORECASE).group() if title: title = title.replace('<title>', '').replace('</title>', '') Existe uma expressão regular para extrair apenas o conteúdo de <title>, para que eu não precise remover as tags?

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.