Estamos com problemas para que o Google indexe os arquivos PDF em nosso site. Existem cerca de 50 PDFs e variam em tamanho de 20 KB a pouco menos de dois megas. Eles não são protegidos, podem ser lidos anonimamente e, dentro do PDF Reader, você pode pesquisar no documento.
Eles estão listados no SiteMap.xml. Eu posso até olhar os logs do IIS e ver o Googlebot lendo os arquivos PDF, mas, com exceção de cinco, eles nunca são incluídos nos resultados da pesquisa.
Se eu fizer um arquivo de filetye: pdf, apenas cinco PDFs aparecerão. Se eu procurar o texto que sei que está dentro de um PDF, os PDFs nunca serão exibidos (exceto os cinco indexados).
Alguém tem alguma idéia de por que os documentos PDF com mais de 45 anos não estão sendo incluídos no índice, mesmo estando no mapa do site e no Googlebot os lendo?