Para impedir que seu arquivo PDF (ou qualquer arquivo não HTML) seja listado nos resultados da pesquisa, a única maneira é usar o X-Robots-Tag
cabeçalho de resposta HTTP , por exemplo:
X-Robots-Tag: noindex
Você pode fazer isso adicionando o seguinte trecho ao arquivo .htaccess raiz do site ou ao arquivo httpd.conf:
<Files ~ "\.pdf$">
Header set X-Robots-Tag "noindex, nofollow"
</Files>
Observe que, para que o procedimento acima funcione, você deve poder modificar os cabeçalhos HTTP do arquivo em questão. Portanto, talvez você não consiga fazer isso, por exemplo, nas páginas do GitHub .
Observe também que robots.txt que não evitar sua página sejam listados nos resultados da pesquisa.
O que ele faz é parar o bot de rastejar sua página, mas se um terceiro ligações do partido para seu arquivo PDF a partir de seu site, sua página ainda serão listados.
Se você impedir que o bot rastreie sua página usando o robots.txt , ele não terá a chance de ver a X-Robots-Tag: noindex
tag de resposta. Portanto, nunca desaprove nunca uma página no robots.txt se você empregar o X-Robots-Tag
cabeçalho. Mais informações podem ser encontradas no Google Developers: Robots Meta Tag .