Encontrei este artigo nas minhas notícias de SEO hoje. Parece implicar que você pode usar Noindex:diretivas além das Disallow:diretivas padrão no robots.txt .
Disallow: /page-one.html
Noindex: /page-two.html
Parece que isso impediria os mecanismos de pesquisa de rastrear a página um e impediria a indexação da página dois.
Esta diretiva robots.txt é compatível com o Google e outros mecanismos de pesquisa? Funciona? Está documentado?
disallowGoogle descobre links nas páginas pai e filho, se houver algum. Embora noindexsimplesmente pare a página sendo listada, ela não para a descoberta, enquanto a proibição o faz.
nofollowfunciona para meta tags. Seria bom saber se esse também é o caso do robots.txt .
<a rel="no-follow">também. Não vejo razão para que isso seja tratado de maneira diferente. Obviamente, isso não é oficial e é recomendado por John Muller para não usá-lo no robots.txt, mas, além do seu tweet, não consegui encontrar muita informação sobre ele.
Noindexdiretiva nos robots.txtarquivos como um erro.