Eu tenho um subdiretório que gostaria de ocultar dos rastreadores da Web do mecanismo de pesquisa.
Uma maneira de fazer isso é usar a robots.txt
no diretório raiz do servidor (a maneira padrão). No entanto, qualquer pessoa que conheça o URL do site e tenha algum conhecimento básico da Web pode acessar o conteúdo do robots.txt e identificar os diretórios não permitidos.
Eu pensei em uma maneira de evitar isso, mas não tenho certeza se vai funcionar.
Let X
Ser o nome do subdiretório que eu quero excluir. Uma maneira de impedir a indexação do X
diretório de rastreadores da Web e, ao mesmo tempo, dificultar a identificação de um X
diretório a partir da raiz robots.txt
, é adicionar robots.txt
o X
diretório ao invés do diretório raiz.
Se eu seguir esta solução, tenho as seguintes perguntas:
- Os rastreadores da Web encontrarão o
robots.txt
subdiretório? (já que umrobots.txt
já existe e também no diretório raiz) Se
robots.txt
estiver noX
subdiretório, devo usar caminhos relativos ou absolutos ?:User-agent: * Disallow: /X/
ou
User-agent: * Disallow: /