Perguntas com a marcação «web-crawler»

5
Como solicitar ao Google que rastreie novamente meu site? [fechadas]
Fechadas. Esta pergunta não atende às diretrizes de estouro de pilha . No momento, não está aceitando respostas. Deseja melhorar esta pergunta? Atualize a pergunta para que ela esteja no tópico do Stack Overflow. Fechado há 5 anos . Melhore esta pergunta Alguém sabe como solicitar ao Google que rastreie …
227 seo  web-crawler 

2
Enviando "User-agent" usando a biblioteca Requests em Python
Desejo enviar um valor "User-agent"ao solicitar uma página da Web usando solicitações de Python. Não sei se é bom enviar isso como parte do cabeçalho, como no código abaixo: debug = {'verbose': sys.stderr} user_agent = {'User-agent': 'Mozilla/5.0'} response = requests.get(url, headers = user_agent, config=debug) As informações de depuração não estão …

4
impeça o rsync de remover arquivos de origem inacabados
Eu tenho duas máquinas, velocidade e massa. O speed possui uma conexão rápida à Internet e está executando um rastreador que baixa muitos arquivos no disco. massa tem muito espaço em disco. Quero mover os arquivos da velocidade para a massa após o download. Idealmente, eu apenas corria: $ rsync …



2
TypeError: não é possível usar um padrão de string em um objeto semelhante a bytes em re.findall ()
Estou tentando aprender como buscar urls automaticamente em uma página. No código a seguir, estou tentando obter o título da página da web: import urllib.request import re url = "http://www.google.com" regex = r'<title>(,+?)</title>' pattern = re.compile(regex) with urllib.request.urlopen(url) as response: html = response.read() title = re.findall(pattern, html) print(title) E recebo …


11
Detectando rastreadores 'furtivos' da web
Que opções existem para detectar rastreadores da web que não desejam ser detectados? (Eu sei que as técnicas de detecção de listagem permitirão ao programador inteligente de rastreamento furtivo fazer uma aranha melhor, mas não acho que algum dia seremos capazes de bloquear rastreadores furtivos inteligentes, apenas aqueles que cometem …
107 web-crawler 



8
Obtenha uma lista de URLs de um site [fechado]
Fechadas. Esta pergunta não atende às diretrizes do Stack Overflow . Atualmente não está aceitando respostas. Quer melhorar esta questão? Atualize a pergunta para que esteja no tópico do Stack Overflow. Fechado há 4 anos . Melhore esta questão Estou implantando um site substituto para um cliente, mas ele não …
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.