Encontrei este artigo nas minhas notícias de SEO hoje. Parece implicar que você pode usar Noindex:
diretivas além das Disallow:
diretivas padrão no robots.txt .
Disallow: /page-one.html
Noindex: /page-two.html
Parece que isso impediria os mecanismos de pesquisa de rastrear a página um e impediria a indexação da página dois.
Esta diretiva robots.txt é compatível com o Google e outros mecanismos de pesquisa? Funciona? Está documentado?
disallow
Google descobre links nas páginas pai e filho, se houver algum. Embora noindex
simplesmente pare a página sendo listada, ela não para a descoberta, enquanto a proibição o faz.
nofollow
funciona para meta tags. Seria bom saber se esse também é o caso do robots.txt .
<a rel="no-follow">
também. Não vejo razão para que isso seja tratado de maneira diferente. Obviamente, isso não é oficial e é recomendado por John Muller para não usá-lo no robots.txt, mas, além do seu tweet, não consegui encontrar muita informação sobre ele.
Noindex
diretiva nos robots.txt
arquivos como um erro.