As versões mais recentes do Joomla não bloqueiam mais as pastas /media/
e /templates/
:
User-agent: *
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /modules/
Disallow: /plugins/
Disallow: /tmp/
Nem todas as extensões seguem as diretrizes de onde colocar arquivos CSS e JS etc., portanto, uma boa solução é permitir que o Google acesse esses arquivos, independentemente de onde eles sejam encontrados.
Você pode conseguir isso inserindo algumas linhas no início do seu robots.txt
arquivo, assim:
#Googlebot
User-agent: Googlebot
Allow: *.css
Allow: *.js
User-agent: *
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /modules/
Disallow: /plugins/
Disallow: /tmp/
EDITAR:
Obrigado @ w3dk e @ Stephen Ostermiller pelo feedback! Você está certo. É melhor fazer algo assim:
User-agent: *
Allow: *.css
Allow: *.js
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /modules/
Disallow: /plugins/
Disallow: /tmp/
Infelizmente, isso não parece funcionar como planejado, porque as regras mais longas (mais específicas) substituem as regras mais curtas e as linhas de permissão são ignoradas. Parece não fazer nenhuma diferença se as linhas de permissão seguem as linhas de proibição ou vice-versa.
A única maneira de conseguir contornar isso é fazer algo assim que parece funcionar quando testo nas Ferramentas do Google para webmasters:
User-agent: *
Allow: /************************************************************.css
Allow: /************************************************************.js
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /layouts/
Disallow: /libraries/
Disallow: /logs/
Disallow: /modules/
Disallow: /plugins/
Disallow: /tmp/
EDIÇÃO 2 - MELHOR SOLUÇÃO:
OK, pesquisei um pouco mais e encontrei a resposta em https://stackoverflow.com/a/30362942/1983389
Parece que a solução mais correta e mais apoiado em todos os rastreadores da web é algo como o seguinte (permitindo o acesso a *.css
e *.js
arquivos nos /bin
, /cache
, /installation
, /language
, /logs
, e /tmp
pastas e, possivelmente, algumas das outras pastas não faz muito sentido):
User-agent: *
Allow: /administrator/*.css
Allow: /administrator/*.js
Disallow: /administrator/
Disallow: /bin/
Disallow: /cache/
Allow: /cli/*.css
Allow: /cli/*.js
Disallow: /cli/
Allow: /components/*.css
Allow: /components/*.js
Disallow: /components/
Allow: /includes/*.css
Allow: /includes/*.js
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Allow: /layouts/*.css
Allow: /layouts/*.js
Disallow: /layouts/
Allow: /libraries/*.css
Allow: /libraries/*.js
Disallow: /libraries/
Disallow: /logs/
Allow: /modules/*.css
Allow: /modules/*.js
Disallow: /modules/
Allow: /plugins/*.css
Allow: /plugins/*.js
Disallow: /plugins/
Disallow: /tmp/
robots.txt
já que ninguém (nem mesmo os mecanismos de pesquisa agora que o Google está exigindo o que você não deve proibir) vai segui-lo de qualquer maneira?