Como filtrar mensagens com emoticons animados no assunto no Gmail?


27

Eu estava vasculhando minha pasta de spam (o que raramente faço, porque o Gmail raramente tem falsos positivos) e notei algo interessante:

lista de exemplo de mensagens de spam

Algo como mais da metade das mensagens tem pelo menos um emoji animado no assunto.

Nenhum dos meus amigos usaria essa porcaria. Nenhuma empresa válida com a qual eu faria negócios jamais faria isso também.

Como posso criar um filtro para, talvez, excluir automaticamente mensagens com emoticons animados no assunto?

Usando a pista de jamesmstone abaixo, tentei pesquisar com subject:=?UTF-8?e subject:"=?UTF-8?"e várias outras permutações, mas nenhuma funcionou.

Aqui está um exemplo de conjunto de cabeçalhos de uma dessas pilhas fumegantes:

Delivered-To: [redacted]@gmail.com
Received: by 10.107.28.200 with SMTP id c191csp1104992ioc;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
X-Received: by 10.107.38.5 with SMTP id m5mr15068933iom.15.1453691236564;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Return-Path: <VivaLoan@mythirdxyz.xyz>
Received: from mythirdxyz.xyz ([2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11])
        by mx.google.com with ESMTP id o10si8722554igw.41.2016.01.24.19.07.15
        for <[redacted]@gmail.com>;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Received-SPF: pass (google.com: domain of VivaLoan@mythirdxyz.xyz designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) client-ip=2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11;
Authentication-Results: mx.google.com;
       spf=pass (google.com: domain of VivaLoan@mythirdxyz.xyz designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) smtp.mailfrom=VivaLoan@mythirdxyz.xyz;
       dkim=pass header.i=@mythirdxyz.xyz;
       dmarc=pass (p=REJECT dis=NONE) header.from=mythirdxyz.xyz
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=mythirdxyz.xyz; 
 i=@mythirdxyz.xyz; q=dns/txt; s=default; t=1453691229; 
 bh=GuM9JCP4yh7WfVbRBortR7UAr6DAtlgy0oTCna0iWQk=; h=MIME-Version : 
 Content-Type : Content-Transfer-Encoding : To : From : Subject : Date : 
 Message-ID : From : Subject : Date; 
 b=e/zS14UB4o5MhYlfbpsy0h2G/oZyoC5H3ouyhNh13zcSHSNXzI6uvJpIy9a+za2ng26Xe2
 NfAI7nenAMCdHJSGF4yfmtTi3+XrR2MqQPHQ1fzTXGhRy/ktCj4tEqt7DhSxnRCqkYFUNaLA
 wh3FMLr6IxPi2Z7xUXm3JBffhDcSU=
MIME-Version: 1.0
Content-Type: text/html; charset="utf-8"
Content-Transfer-Encoding: base64
To: [redacted]@gmail.com
From: "APPROVAL DEPARTMENT" <VivaLoan@mythirdxyz.xyz>
Subject: =?utf-8?q?=F3=BE=93=A0_Personal_loan_as_soon_as_tomorrow_=F3=BE=93=A0?=
Date: Sun, 24 Jan 2016 19:07:09 -0800
Message-ID: <A112ED51-1674-4902-BF73-F2EBCBA42CAF@mythirdxyz.xyz>

3
Eu me pergunto se eles são goomoji...
jamesmstone

@ jamesmstone: Espero que sejam.
ale

Respostas:


9

Resposta curta

Em vez de usar os Filtros do Gmail que dependem do recurso de pesquisa do Gmail para pesquisar os emojis codificados nas mensagens originais , crie um script usando o método GmailMessage :: getRawContent () do Script do Google Apps para processar as mensagens.

Perguntas relacionadas

A seguir, estão links para respostas a perguntas semelhantes neste site, incluindo scripts usando o método referido.


2
Vale ressaltar que um script não pode excluir completamente uma mensagem - o máximo que pode fazer é movê-lo para a pasta Lixeira ou Spam. E se essas mensagens já forem enviadas para spam, há pouco benefício com o script.

@ Minestrone: Na verdade, é possível excluir completamente uma mensagem usando um script. Ele deve usar a API do Gmail. Consulte developers.google.com/gmail/api/v1/reference/users/messages/… . Para usar a API do Gmail no Script do Google Apps, consulte developers.google.com/apps-script/guides/services/advanced .
Rubén

11
Não estou muito interessado em excluir a mensagem, mas em encontrar uma maneira de filtrá-la. Eu poderia simplesmente querer colocar um rótulo para eles.
ale

@AlE. Eu assumi isso, então não mencionei o uso da API GMAIL no corpo da resposta. Por outro lado, felizmente não recebi email com emojis no assunto.
Rubén

4

Eu criei um script do Google Apps para esses fins.

Está no Github: https://github.com/spamzero/spamzero

Ele permite que você crie todos os tipos de regras avançadas que podem ser comparadas à sua pasta de mensagens de spam, para que as mensagens definitivamente spam sejam limpas automaticamente.


11
Sua resposta será melhor se você incluir uma breve descrição do script, destacando como ele ajudará a lidar com mensagens com emojis animados no assunto.
Rubén

4
Eu concordo com @ Rubén, quanto mais informações, melhor. Uma vez que permite que os leitores examinem a viabilidade das respostas sem pular muitos obstáculos.
Michelfrancis Bustillos 14/03

Obrigado por este script! Às vezes, as soluções mais úteis são as que reduzem aborrecimentos diários, como spam animado. Sugiro que você adicione ao README do Github este link para o Início rápido de scripts do Google Apps para que os usuários que não têm experiência no uso de scripts saibam como ativar a API do Gmail e visualizar os registros.
dan

1

Isso não é exatamente o que você está solicitando (filtrando os emojis em si e não as mensagens com emojis), mas você pode encontrar parte do conteúdo útil para criar um melhor filtro de mensagens.

Agora existe um script de usuário de código-fonte aberto Greasemonkey / Tampermonkey / Violentmonkey para livrar-se daquelas baratas visuais irritantes (apenas os personagens, não as próprias mensagens):

Assunto do Gmail Emoji Roach Motel

Olhando a fonte desse script , você verá que existem dois tipos gerais de baratas de emoji que você encontrará em e-mails de profissionais de marketing abusivos (atualmente, infelizmente, incluindo eBay e Amazon):

  • Baratas baseadas em imagem HTML (incluindo as horríveis animadas) aka goomoji

  • Baratas Unicode: ainda existem muitos emojis (e outras sequências Unicode gerando imagens) que os spammers e outros profissionais de marketing antigos estão começando a usar nas linhas de assunto do email e que o gmail não converte em imagens HTML. Em alguns navegadores, eles aparecem em negrito e coloridos, o que é quase tão ruim quanto a animação. Os navegadores também podem optar por animá-los, mas não sei se existem. Essas seqüências Unicode são exibidas pelo navegador como texto Unicode; portanto, a aparência exata (colorida ou não, animada ou não, ...) depende de qual sistema de renderização de texto o navegador está usando. A aparência de um determinado emoji Unicode também depende de qualquer seletor de variação Unicode e modificador de emojique aparecem perto dele na sequência de pontos de código Unicode. Diferentemente do spam emoji baseado em imagem, essas seqüências podem ser copiadas e coladas do navegador e em outros aplicativos como texto Unicode.

Para o último tipo, o userscript inclui uma expressão regular projetada para capturar as seqüências Unicode que provavelmente serão abusadas pelos profissionais de marketing. A regex se parece com isso no Javascript ES6 (o script do usuário traduz isso para a regex pré-ES6 amplamente suportada, usando o incrível Transpiler ES6 Regex ):

var re = /(\p{Emoji_Modifier_Base}\p{Emoji_Modifier}?|\p{Emoji_Presentation}|\p{Emoji}\uFE0F|[\u{2100}-\u{2BFF}\u{E000}-\u{F8FF}\u{1D000}-\u{1F5FF}\u{1F650}-\u{1FA6F}\u{F0000}-\u{FFFFF}\u{100000}-\u{10FFFF}])\s*/gu

// which includes the Unicode Emoji pattern from
//   https://github.com/tc39/proposal-regexp-unicode-property-escapes
// plus also these blocks frequently used for spammy emojis
// (see https://en.wikipedia.org/wiki/Unicode_block ):
//   U+2100..U+2BFF     Arrows, Dingbats, Box Drawing, ...
//   U+E000..U+F8FF     Private Use Area (gmail generates them for some emoji)
//   U+1D000..U+1F5FF   Musical Symbols, Playing Cards (sigh), Pictographs, ...
//   U+1F650..U+1FA6F   Ornamental Dingbats, Transport and Map symbols, ...
//   U+F0000..U+FFFFF   Supplementary Private Use Area-A
//   U+100000..U+10FFFF Supplementary Private Use Area-B
// plus any space AFTER the discovered emoji spam
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.