De acordo com a lista em http://www.useragentstring.com/pages/useragentstring.php?typ=Browser com mais de 9000 seqüências de agentes de usuários de vários navegadores:
- 0 sequências de agentes do usuário dos navegadores contêm a palavra "bot"
- 2 sequências de agentes do usuário dos navegadores contêm a palavra "rastrear"
- 0 strings de agentes do usuário de navegadores contém a palavra "spider"
(O 2 que contém "rastreamento" é o seguinte: "Mozilla / 4.0 (compatível; MSIE 5.01; Windows NT 5.0; YComp 5.0.2.6; MSIECrawler)" e "Mozilla / 4.0 (compatível; MSIE 5.01; Windows NT 5.0; MSIECrawler ) "Eu acho que é seguro não considerar isso.)
De acordo com a lista em http://www.useragentstring.com/pages/useragentstring.php?typ=Crawler com 442 strings de agente de usuário listadas como bots:
- 208 seqüências de bots do agente do usuário contém a palavra "bot"
- 63 sequências de bots do agente do usuário contém a palavra "rastrear"
- 37 seqüências de bots de agente de usuário contém a palavra "aranha"
- 282 seqüências de bots de agentes de usuário contêm "bot", "crawl" ou "spider"
Minha conclusão: é seguro filtrar bots por sequências de agentes do usuário com as palavras "bot", "crawl" e "spider". Não é à prova de balas, mas é definitivamente melhor que nada.
Nota: Ao pesquisar as palavras-chave, usei a pesquisa sem distinção entre maiúsculas e minúsculas.
bot
,crawl
,spider
, e mesmosearch
.