Atualização : o seguinte funciona, ele imprime <meta name="robots" content="noindex,follow" />
na seção principal de todas as páginas acessadas por um caminho que começa com comment
. Isso serve para contornar o fato de que uma página como comment / 3 carrega internamente node / nid como argumentos, como jmarkel apontou acima.
<?php
function metarobots_comment_help() {
$url_components = explode('/', request_uri());
if ($url_components[1] == 'comment') {
$elements = array(
'#tag' => 'meta',
'#attributes' => array(
'name' => 'robots',
'content' => 'noindex,follow',
),
);
drupal_add_html_head($elements, 'robots');
}
}
Com a ajuda de um comentário útil sobre a função arg .
Espero que isso acabe por ser tratado pelo módulo Meta Tags - há uma solicitação de recurso , mas ainda não está claro se o autor do módulo deseja dar suporte a isso.
[Meu comentário anterior] Eu só queria acrescentar que o uso do robots.txt não é a resposta - como você já percebeu, os links continuam aparecendo nos resultados da pesquisa, apesar do uso Disallow: /comment
. Isso é esperado, já que o robots.txt diz ao bot para não rastrear essas páginas, mas não diz ao Google para não indexá-lo. Conforme explicado nas práticas recomendadas de SEOmoz Robots.txt e Meta Robots para otimização de mecanismos de pesquisa :
Na maioria dos casos, os meta-robôs com os parâmetros "noindex, follow" devem ser empregados como uma maneira de restringir o rastreamento ou a indexação.
Bloquear com Robots.txt - Isso diz aos mecanismos para não rastrear o URL fornecido, mas informa que eles podem manter a página no índice e exibi-la nos resultados.
Bloquear com Meta NoIndex - Isso informa aos mecanismos que eles podem visitar, mas não têm permissão para exibir o URL nos resultados. (Esse é o método recomendado) Portanto, a meta tag noindex que você procura é realmente o que você precisa.
robots.txt
arquivo?