Como eles encontram a página 'registro de novo usuário'? (Estou especialmente surpreso porque alguns fóruns não têm uma URL dedicada para isso, por exemplo, www.forum.com/register.html, mas use cadeias de consulta ou até outros métodos invisíveis à barra de URLs)
Eles encontram novos sites por:
- Rastreando e procurando assinaturas de software conhecido. Geralmente, esse é um trecho de texto, como um copyright ou uma metatag, mas pode ser qualquer identificador consistente. Isso geralmente se aplica ao software de blog e fórum.
- Inclusão manual. Os seres humanos, cuja mão-de-obra é barata em muitas partes do mundo, procuram softwares ou formas conhecidos que sejam facilmente exploráveis e os adicionam a um banco de dados. Isso geralmente se aplica a formulários personalizados de registro e contato.
- Eles compram listas. Assim como os endereços de email são vendidos por remetentes de spam, também são vendidas listas conhecidas de sites vulneráveis ou preferenciais.
Como eles sabem o que inserir em cada campo 'novo registro de usuário'?
Eles sabem o que inserir em cada campo usando os nomes dos campos como guia. 99,99% do tempo em que o campo de endereço de email é nomeado "email" ou algo que contenha a palavra "email". Você não precisa ser um cientista de foguetes para saber que esse campo provavelmente é para um endereço de email. Para coisas como nomes, ID de login, endereços etc., funciona com o mesmo princípio.
Como eles determinam em que página eles podem spam / inserir dados e o que não é?
Eles não se importam. As ferramentas automatizadas podem tentar tantos formulários em um período tão curto de tempo e praticamente sem custos, portanto, tentar todos os formulários possíveis é uma tarefa fácil. Quando o trabalho humano está envolvido, eles podem ser "roteiristas" e tentar as coisas óbvias para ver se obtêm algum tipo de resposta que indique que o formulário é potencialmente vulnerável. Basicamente, qualquer formulário é um destino potencial para eles, assim como qualquer página que aceite entrada do usuário.
Como funcionam os spambots do fórum?
Eles 'visualizam' essa página? ..Se não, então eu assumiria que eles estão se comunicando diretamente com o servidor - como é - isso é possível? Como eles fazem isso?
De onde vêm os spambots? Alguém está sentado atrás do computador rindo enquanto assiste seu bot destruir site após site? Ou eles estão rindo quando simplesmente 'lançam' na internet de alguma forma? Os spambots são 'executados' por um computador infectado em algum lugar? Eles se replicam?
É tudo automatizado. Ferramentas como o xrumer são construídas, vendidas e contêm a capacidade de explorar software com vulnerabilidades conhecidas. Qualquer um pode comprá-lo e depois de configurá-lo, é mais ou menos fogo e esqueça. Ele acessa todos os fóruns de sua lista e tenta enviá-lo da melhor forma possível. Apenas devido à força bruta, é bem-sucedido e vale a pena para os spammers. É por isso que eles nunca param. Eles mal têm que levantar um dedo para que funcione.
Os spambots do fórum podem quebrar os CAPTCHAs? Eles podem resolver questões de lógica (como?)? Questões de matemática?
Sim, mas nem sempre. Depende de quão bem ele é implementado. Mas muitos captchas, incluindo os oferecidos por grandes empresas, foram derrotados e são efetivamente inúteis. É por isso que várias formas de proteção são necessárias para detê-las. Mesmo assim, os humanos geralmente podem derrotar qualquer sistema.
Que técnicas ainda são válidas para evitá-las?
De uma resposta anterior : você pode fazer várias coisas (e deve fazer mais do que uma), incluindo:
1) Colocar um campo falso que apenas os bots verão. Se esse campo for enviado com o restante do formulário, você poderá ignorá-lo (e bani-lo, se desejar). Você também pode interceptar bots ruins que seguem um link oculto .
2) Use um CAPATCHA como reCAPTCHA
3) Use um campo que exija que o usuário responda a uma pergunta como a 5 + 3. Qualquer humano pode responder, mas um bot não saberá o que fazer, pois está preenchendo automaticamente os campos com base nos nomes dos campos. Portanto, esse campo estará incorreto ou ausente. Nesse caso, o envio será rejeitado.
4) Use um token e coloque-o em uma sessão e também adicione-o ao formulário. Se o token não for enviado com o formulário ou não corresponder, será automatizado e poderá ser ignorado.
5) Procure envios repetidos do mesmo endereço IP. Se o seu formulário não receber muitas solicitações, mas de repente ele provavelmente está sendo atingido por um bot e considere bloquear temporariamente o endereço IP.
6) Use Akismet . É ótimo para identificar spam.