Existem indicadores claros de que meu arquivo de sitemap é benéfico?


73

Recentemente, criei um arquivo sitemap.xml e o carreguei na minha conta do Google Webmasters Tools . O Google não relatou nenhum problema ou erro com o mapa do site carregado do meu site.

Agora minha pergunta é:

  • Como sei se meu sitemap está funcionando nas Ferramentas do Google para webmasters?

A razão pela qual pergunto é que não sei o que devo estar vendo ou procurando, e parece que carreguei um arquivo inútil.

Respostas:


93

Um arquivo de Sitemap ajuda os mecanismos de pesquisa a descobrir URLs novos e atualizados em seu site. Em particular, se o seu site for bastante grande, isso poderá ajudá-los a se concentrar no conteúdo novo e atualizado, em vez de ter que percorrer tudo cegamente para ver se alguma coisa mudou. Isso pode resultar na descoberta de novos conteúdos muito mais rapidamente, o que pode ser bastante perceptível, especialmente se o site for maior ou mais complexo.

Com o Google em particular (trabalho no Google; não sei como outros mecanismos de pesquisa lidam com isso), ele também faz o seguinte:

  • Encontre o número de URLs indexados para o seu site: essas estatísticas são recalculadas diariamente e são muito precisas. Você pode encontrá-los na página de detalhes dos Sitemaps .
  • Descubra problemas de canonização: se os números correspondentes não corresponderem , isso significa que você está especificando URLs no arquivo Sitemap que não correspondem ao que encontramos durante o rastreamento. Isso geralmente é um sinal de que você precisa trabalhar na canonização .
  • Ajuda com a canonização: quando encontrarmos no seu site vários URLs que mostram conteúdo idêntico, daremos a qualquer URL listado em um Sitemap uma vantagem extra, mesmo que você não use outros métodos de canonização.
  • Encontre partes mal indexadas do seu site: essas contagens são fornecidas por arquivo Sitemap, para que você possa criar arquivos separados para seções lógicas do site, para descobrir áreas em que o Google não está indexando tanto quanto você gostaria.
  • Priorizar erros de rastreamento: na seção erros de rastreamento , os URLs especificados nos arquivos de Sitemaps são listados separadamente. Como você forneceu esses URLs especificamente, assumimos que você deseja indexá-los e que quaisquer erros de rastreamento são importantes.

Além disso, você pode usar várias extensões nos arquivos de Sitemaps (por exemplo, imagens, vídeo, Notícias ou internacionalização), caso opte por fazê-lo. Essas extensões são todas opcionais.

Para a maioria dos sites, o elemento mais visível dos arquivos de Sitemaps é que você pode ver a contagem de URLs indexados. Pode demorar um dia ou mais para aparecer. Portanto, se você acabou de enviar um Sitemap pela primeira vez, pode ser um pouco paciente. Embora outras maneiras (por exemplo, um site: -query) sejam aproximações muito, muito grosseiras, essa contagem é extremamente precisa.

Editado para adicionar: outra coisa que considero extremamente útil em relação aos Sitemaps é que, se você não os está gerando diretamente com o seu CMS, invariavelmente descobrirá muito sobre como o site é rastreável e que tipo de URL é descoberto durante esse processo. Eu já vi muitos casos em que o rastreamento de um site com uma ferramenta do seu lado (por exemplo, um gerador de Sitemaps) elimina problemas que você pode perder de outra forma, seja o ID da sessão nos URLs, o conteúdo duplicado por diferenças de URL, espaços infinitos (como como calendários sem fim) ou mesmo partes de um site que não estão vinculadas.


Ótima informação. Também ouvi dizer que, com alguns sites com alto tráfego rastreado, é melhor não usar um mapa do site, porque o Google faz um trabalho de rastreamento melhor e, se houver algo faltando no seu site, ele pode parar de ser indexado.
31412 Chris_O

3
@ Chris_O Você está misturando diferentes problemas juntos. Nesse exemplo, não é que o Google esteja fazendo um trabalho "melhor" por conta própria; o próprio mapa do site está com defeito. Essa não é uma linha direta de argumento para "não usar um mapa do site". A solução para essa situação é corrigir o mapa do site. Além disso, os sitemaps são informativos, não diretivas. Algo que falta no mapa do site não significa que o Google não o encontre por conta própria ou o desconsidere.
Su '30 de

O site em questão possui mais de 40 mil páginas indexadas e o novo conteúdo é indexado em menos de 5 minutos (sem mapa do site). Com base na sua resposta, começaremos a construí-los e dividi-los em anos.
30512 Chris_O

@ john-mueller oi sr. m. - uma vez enviei um sitemap de teste com 1000 URLs, recuperamos uma contagem de índice de cerca de 700, agora testamos todos os 1000 URLs através do site: www.complete.org/url/to/the/page.html, voltamos uma contagem bem abaixo das 700 urls (mais na região 200). O que isto significa?
Franz

2
@Franz Às vezes há detalhes envolvidos que dificultam a reprodução da contagem de URLs indexados com site: -queries. Por exemplo, há situações em que podemos combinar vários URLs e mostrar apenas um deles para um site: -query. Portanto, se você vê uma diferença, geralmente não vale a pena se preocupar.
John Mueller

6

Se você não estiver recebendo nenhum erro, pode presumir que o Google o analisou e está ciente do conteúdo. Mas isso não significa que eles rastrearão e / ou indexarão essas páginas. Os Sitemaps são apenas outra maneira de informar os mecanismos de pesquisa sobre suas páginas. Eles não são obrigados a rastrear e indexar uma ou todas essas páginas. O mesmo se aplica à localização de páginas por meio de links ou envios de URL.


11
Como informações adicionais, é muito fácil ver se o Google entende o mapa do site. Verifique em Otimizações -> Sitemaps. Ele informará quantos URLs foram enviados no mapa do site. O mapa do site foi lido com sucesso e encontrou muitos links nele. O segundo número é quantos foram indexados e, como aponta John, completamente até o Google sobre se eles acham que nenhum, alguns ou a maior parte do seu conteúdo vale a pena. Sempre será menor que o valor enviado, o Google apenas acha que algumas páginas não são tão boas e não se incomoda com elas.
Fiasco Labs

1

O Google geralmente faz um bom trabalho de rastrear seu site se você tiver um bom número de links de qualidade. Se você está gastando muito tempo olhando o número de páginas indexadas, sugiro que seja melhor melhorar seu site e obter alguns links de qualidade.


0

Talvez uma ferramenta de validação de mapa do site como esta , embora eu nunca "não" tenha visto o mapa do site começar a funcionar.


O arquivo já foi validado. Essa não é a questão.
Su '27 de

0

Para sites maiores, por exemplo, sites com centenas, milhares ou milhões de páginas, é bastante útil. Tivemos em nosso site da empresa 400.000 páginas em que URLs foram criados dinamicamente por ID de conteúdo e parâmetros de URL foram usados ​​com &, as Ferramentas do Google para webmasters fornecerão feedback sobre as páginas rastreadas e mostrarão erros, você pode depurar ou abrir a página e veja por si mesmo o que está errado. Dessa forma, o Google nos ajudou a criar um site melhor e nos poupou do enorme embaraço algumas vezes.

Também é útil ver o número de páginas indexadas versus o número de rastreados.

Para sites menores, se o site for um pequeno grupo de páginas .html em que cada página é vinculada por meio de menu e o site não for atualizado com frequência, se você fizer o upload do mapa do site, nada será alterado nos resultados da pesquisa. Você não terá nenhuma vantagem de enviar o mapa do site sobre alguém que não o enviou.

Eu também costumava ter cerca de 20 sites pequenos, nos quais os sitemaps eram gerados automaticamente pelo script cron e parei de fazer isso. Um dia, descobri que os arquivos XML não são gerados corretamente por cerca de 6 meses por meu erro, mas felizmente o Google ignorou meu erro e indexou esses sites totalmente, mesmo quando os sitemaps apresentavam erros, o Google usa o sitemap apenas como uma dica para onde ir, não muito sério.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.