Qual meta tag "robôs" recebe preferência?

Minha esposa trabalha em uma escola na Alemanha. Recentemente, notei que é extremamente difícil encontrar a página inicial dessa escola usando o Google. Eu olhei o código fonte da página e acredito que encontrei o motivo: existem duas <meta name="robots">tags; um é

<meta name="robots" content="all">

e o segundo, mais abaixo na página, é

<meta name="robots" content="noindex, follow">

Meu palpite é que o segundo supera o primeiro e impede o Google de indexar o site. Estou certo? Eu não gostaria de dizer ao webmaster que eu encontrei o problema e me fazer de idiota (porque eu realmente não sei nada sobre como criar uma página da web adequada, muito menos fazer SEO).

A propósito, se você encontrar outras bobagens no site, ficaria feliz em poder denunciá-las. Meu próximo candidato seria a total falta de metatags relevantes que transmitam informações sobre o conteúdo da página.

seo web-crawlers meta-robots

— Tim Pietzcker
fonte

A Wikipedia alemã afirma que <meta name="robots" content="all"> é semanticamente igual a <meta name="robots" content="index, follow">, portanto as duas metatags estão contraditórias de qualquer maneira. Eu iria notificar o webmaster. Também acho que o Google escolherá a política mais rígida e, portanto, não indexará a página para evitar problemas de direitos autorais.

— Matthias Ronge

Vi também que, no final da página, duas solicitações são enviadas para servidores de terceiros ( ajax.googleapis.come ssl.google-analytics.com). Essa pode ser uma questão legal contra o privilégio da autodeterminação informacional na Alemanha. Eu recomendaria evitar isso.

— Matthias Ronge

Existem também dois titleelementos. E o mesmo se repete em outras páginas, não apenas na página inicial! De fato, não parece haver nenhuma página indexada, além de um punhado de PDFs !? Módulos conflitantes no CMS, talvez ?! Problema secundário ... Conforme declarado nas respostas, a regra mais restritiva será aplicada pelos mecanismos de busca - não necessariamente a regra posterior. No entanto, uma função como a do PHP get_meta_tags()retornará apenas a regra posterior - portanto, há um problema (potencial) imediato em ter várias metatags para os mesmos dados.

— MrWhite

@ w3d: Obrigado pelas idéias! Isso é muito útil.

— Tim Pietzcker

Respostas:

Enquanto a Wikipedia alemã afirma que allé um valor válido, não tenho idéia de onde essas informações vêm, e a Wikipedia alemã não cita nenhuma fonte. É AFAIK errado, e IMHO é um bom exemplo de por que não se deve confiar na Wikipedia para esse tipo de informação.

Se você deseja usar a metatag do robô para direcionar o googlebot , a melhor informação sobre valores válidos é a central de webmasters do Google . Ele lista os seis seguintes valores como válido: noindex, nofollow, noarchive, nosnippet, noodp, none.

Em outras palavras, para o googlebot :

meta name="robots" content="all">

é um erro de sintaxe e será ignorado, enquanto:

<meta name="robots" content="noindex, follow">

é uma sintaxe válida e será obedecida (por isso, é extremamente difícil encontrar a página inicial dessa escola usando o Google).

Para responder à sua segunda pergunta, o que acontece se duas metatags de robôs válidas entrarem em conflito, o Google diz (mesma página que a vinculada acima):

Se os valores do conteúdo entrarem em conflito, usaremos os mais restritivos.

Quanto às metatags, aqui está uma visão geral das metatags reconhecidas pelo Google .

— Svartepjotr
fonte

Obrigado pelo link para a central de webmasters do Google. Vou dar isso ao webmaster da escola.

— precisa saber é o seguinte

As metatags de robôs estão documentadas em detalhes em developers.google.com/webmasters/control-crawl-index/docs/… - a maneira mais simples de lembrar é que as "positivas" (todas, indexe, siga) não têm efeito em tudo.

— John Mueller

O comportamento de duas metatags conflitantes não está definido, até onde eu sei, mas provavelmente a regra mais restritiva vencerá.

Isso acontece no caso semelhante da tag arquivo robots.txt vs meta robots. Se o robots.txt impedir a indexação de uma página e os meta-robôs não, a página não será indexada. E se o robots.txt permite uma página, mas os meta-robôs a bloqueiam, ela ainda não será indexada.

Portanto, a lógica ditaria que, se houver duas metatags conflitantes, se uma bloquear a indexação, ela substituirá a outra (independentemente de seus respectivos locais na página).

Você deve perguntar ao webmaster se eles estão bloqueando os mecanismos de pesquisa por um motivo específico. Caso contrário, remova as duas metatags (o padrão é permitir que os mecanismos de pesquisa não tenham razão para ter a tag).

Quanto à outra parte da sua pergunta, as análises de sites estão fora do escopo dos Pro Webmasters. Mas vou acrescentar que a tag meta description é provavelmente a única que você achará útil. A tag meta keywords não é usada por nenhum mecanismo de pesquisa.

— DisgruntledGoat
fonte