Respostas:
Nenhum bot que esteja coletando e-mails ou testando vulnerabilidades no seu site respeitará o seu robots.txt. De fato, esses robôs maliciosos examinam o robots.txt para mapear melhor seu site. Se algum ponto você tiver, Disallow:
isso será usado para atacar melhor o seu site. Um hacker que está olhando manualmente para o seu site deve gastar tempo extra examinando todos os arquivos / diretórios que você está tentando proibir.
O robots.txt não aumenta a segurança do seu site ou impede a coleta de endereços de email. O robots.txt é um guia para os mecanismos de pesquisa pularem seções do seu site. Elas não serão indexadas e devem ser usadas para as seções que você não deseja exibir nos mecanismos de pesquisa públicos.
No entanto, isso não impedirá que outros bots baixem o site inteiro para aumentar a segurança ou impedir a coleta de emails. Para aumentar a segurança, você precisa adicionar autenticação e permitir apenas usuários autenticados além das seções seguras. Para impedir a coleta de endereços de email, não coloque emails em texto sem formatação (ou texto facilmente decifrável) em um site.
O arquivo robots.txt serve apenas como uma solicitação para que bots e aranhas deixem certas partes de conteúdo em paz; na verdade, não pode impedir o acesso deles. Os bots "bons" o respeitarão, mas os "ruins" (provavelmente os que você deseja bloquear) o ignorarão e continuarão assim mesmo.
Em vez do robots.txt, talvez você precise usar os códigos CAPTCHA.