Estou tentando executar um comando regex para analisar os e-mails recebidos para identificar quaisquer hiperlinks enviados por sites de phishing / phishing tentando usar uma variação do nome da empresa. Nossa empresa é abcdomain. Os critérios são:
- Encontre todos os hiperlinks (parte do nome do host) que contenham o nome da empresa 'abcdomain'
- Excluir todos os domínios que nos registramos, por exemplo, meuabdomínio.com, site.abcdomain.com, abcdomain.net, etc.)
Meu regex não está bem formado e não funciona sob algumas variações. O problema provavelmente está relacionado à maneira como eu excluo. No começo, eu estava realmente tentando excluir 'abcdomain.com', mas o regex não parecia funcionar dessa maneira.
- Inquerir:
(http[s]?|ftp)\S*?(abcdomain|myabcdomain)(?!\.com)
- Corda:
http://www.abcdomain.com/logo/email/abcdomain-email-logo.png
Resultado: isso deve ser excluído, mas a consulta ocorre no segundo abcdomain
Inquerir:
(http[s]?|ftp):\/\/([\dA-Za-z\.]*)(abcdomain|myabcdomain)(?!.com|..net)
- Corda:
http://www.fakeabcdomain.com
- Resultado: isso deve ser incluído, mas minha exclusão cuida apenas do resultado da ocorrência)
Só queria mostrar exemplos do que deveria acontecer e do meu próprio progresso. regexr.com/3trtg
—
David Rubino
Parece que pode haver um número infinito de maneiras de ignorar uma pesquisa de regex, não importa quão cuidadosamente o regex seja criado. Existem outras opções disponíveis para você? Você pode filtrar por localização geográfica de IP dos remetentes, possivelmente rastrear o hiperlink e verificar se ele se conecta a um ip interno (lista de permissões), rastrear o hiperlink e ver se ele gera uma solicitação de pacote no servidor / controlador de domínio (como classificação de um aperto de mão para verificar o link) ou alguma outra forma de verificação que possa ser mais segura. Regex é tudo que você tem a opção de usar?
—
Trenly