Estamos vendo algumas páginas que existem no nosso, sitemap.xml
mas estão inexplicavelmente ausentes do índice de pesquisa pública do Google.
Você não pode baixar /superuser//sitemap.xml - protegemos este arquivo porque houve problemas com ele no passado - mas o googlebot pode. Verificamos através das Ferramentas do Google para webmasters que o sitemap.xml
arquivo foi baixado hoje e está classificado como OK sem erros (marca de seleção verde).
O sitemap.xml
contém uma lista das últimas 50.000 perguntas em nosso site que foram feitas. Por exemplo, esta pergunta ...
/superuser/201610/how-to-see-the-end-of-a-long-chain-of-symbolic-links
... existe no as sitemap.xml
...
<url>
<loc>/superuser/201610/how-to-see-the-end-of-a-long-chain-of-symbolic-links</loc>
<lastmod>2010-10-20</lastmod>
<changefreq>daily</changefreq>
<priority>0.2</priority>
</url>
A pesquisa de "Como ver o final de uma longa cadeia de links simbólicos" fornece apenas um resultado ao questionhub.com, que está raspando nossos dados (um problema totalmente diferente).
Você pode aumentar o número da contagem de perguntas e fazer uma pesquisa exata pelo título da pergunta e verá esse padrão persistir.
Esses URLs estão no sitemap.xml, mas não estão aparecendo no índice do Google - e, no entanto, são exibidos em sites que raspam os dados de nossos criativos comuns. Por que isso seria?