Como combater os remetentes de spam do Google Analytics?


43

Nos últimos meses, tenho muitos spammers de referência nas minhas estatísticas do GA. A contagem deles é ~ 10x maior que a contagem de visitantes legítimos (meu site ainda não é muito popular). Ativei uma opção para ocultar spammers conhecidos nas configurações do GA, mas isso não ajudou em nada. Parece que esses spammers estão usando scripts para enviar spam diretamente para o GA (ou seja, eles não estão registrados no meu IIS).

Existe algo que eu possa fazer para impedir esses spammers?

UPD 10 meses depois, e eles começaram a enviar spam usando nomes de páginas de destino falsos ... e o Google ainda não está fazendo nada a respeito.


1
Verifique os arquivos de log em busca de ocorrências com spam de referência e informe-nos se houver algum. Se puder, edite a pergunta e inclua o spam de referência em questão. Eu suspeito que já sei a resposta. Estou pesquisando e há uma quantidade considerável de atividades de referência ultimamente, algumas das quais eu já experimentei. Além disso, se você possui o WordPress instalado, verifique se está atualizado. Um dos sites também parece estar atrás de vulnerabilidades do WP. Além disso, não visite nenhum desses sites a menos que você use um navegador de texto como o Curl.
Closetnoc

@closetnoc, esses spammers não estão registrados no meu servidor. Como escrevi, eles estão enviando spam diretamente para o GA. Eu não uso o WP. "inclua o spam referenciador em questão" - o que você quer dizer?
precisa saber é o seguinte

Eu sei quem eles são e postei uma resposta.
closetnoc

Definitivamente, a melhor e mais fácil maneira de evitar isso é usar: referrerspamblocker.com É uma configuração automatizada de filtros no Google Analytics. O uso há meses.
Rody van Sambeek

A configuração de 'filtragem de bot' como verdadeira nas configurações do Google Analytics ajuda a resolver o problema? - lunametrics.com/blog/2014/08/07/…
sam

Respostas:


7

O spam está ficando fora de controle. A lista está crescendo e é demorado e nem eficiente adicionar um filtro para cada um dos remetentes de spam, já que a maioria deles aparece por alguns dias e depois desaparece e um novo chega.

Há muitas informações erradas, o erro mais comum é recomendar o uso do .htaccess , esse arquivo bloqueia o acesso ao site, embora existam alguns rastreadores (5 ou 6) que podem ser bloqueados, a grande maioria do spam nunca acessar seu site é Spam fantasma.

A melhor maneira de impedir esse tipo de spam (Ghosts) é criar um filtro de nome de host válido ; o spam fantasma usa um nome de host falso ou não definido; portanto, com esse filtro, você não precisa adicionar filtros infinitos, um filtro será necessário. cuidar do spam antigo e novo. . Utiliza esta solução com sucesso há 3 meses

Mais informações sobre esse método aqui:

https://stackoverflow.com/a/28354319/3197362


Fico feliz que esta seja a resposta aceita, ela realmente deve ser mais apreciada. A grande maioria dos referenciadores de spam no Analytics são referências fantasmas. Há alguns que você precisa bloquear .htaccess, mas essa é uma batalha contínua para impedi-los de distorcer os números (Semalt é o principal culpado disso - o legítimo bot minha tia Fanny).
precisa saber é o seguinte

Oh Carlos, estou prestes a recomendar o guia para combater spam no seu site . Eu sei que este comentário será percebido como uma forma de SEO / venda, mas não é. Eu realmente admiro a sua opinião sobre esse guia.
Ooker

35

OK. Sem conhecer os sites em questão, tentarei explicar um pouco do que está acontecendo e fornecerei apenas alguns links.

De: http://www.cradlecloud.com/ban-block-blackhatworth-com-spam-referrals/

Recebo os seguintes nomes de domínio associados ao novo método de spam de referência que as pessoas estão vendo ultimamente.

  • BlackHatWorth.com
  • Iskalko.ru
  • Lomb.co
  • Lombia.co
  • Econom.co
  • Darodar.com
  • ILoveVitaly.Com
  • Priceg.com
  • Hulfingtonpost.com (adicionado em 16 de janeiro de 2015)
  • Bestwebsitesawards.com (Novo- adicionado em 3 de fevereiro de 2015)
  • Ranksonic.info (adicionado em 3 de fevereiro de 2015)
  • Cenoval.ru (adicionado em 6 de fevereiro de 2015)
  • oo-6-oo.com (adicionado em 25 de fevereiro de 2015)
  • Humanorightswatch.org (adicionado em 4 de março de 2015)
  • S.click.aliexpress.com (Novo- adicionado em 17 mar 2015 - Suspeito)
  • www1.social-buttons.com (Novo- adicionado em 23/03/2015 - Suspeito)
  • 4webmasters.org (Novo- adicionado em 26 mar 2015 - Suspeito)
  • Googlsucks.com (adicionado em 07/04/2015)
  • Addons.mozilla.org (Novo- adicionado em 07/04/2015 - Suspeito)
  • Smallseotools.com (Novo- adicionado em 13/04/2015 - Suspeito)
  • Theguardlan.com (adicionado em 14 de abril de 2015)
  • Buy-cheap-online.info (Novo- adicionado em 16/04/2015 - Suspeito)
  • Site1.free-share-buttons.com (Novo- adicionado em 29/04/2015 - Suspeito)
  • Sanjosestartups.com (adicionado em 25 de maio de 2015)
  • Trafficmonetize.org (adicionado em 03 de junho de 2015 - Suspeito)
  • Howtostopreferralspam.eu (adicionado em 09 de junho de 2015 - suspeitado)
  • Www10.free-social-buttons.com (Novo- adicionado em 16 de junho de 2015 - Suspeito)
  • Getitfree.us (Novo - adicionado em 18 de junho de 2015 A propriedade não pode ser determinada. Obrigado - Trey Copeland)
  • Www6.free-social-buttons.com (Novo- adicionado em 18 de junho de 2015 - Suspeito)
  • Erot.co (adicionado em 26 de junho de 2015 - Suspeito)
  • 3g2upl4pq6kufc4m.onion (adicionado em 04 de julho de 2015 - Suspeito)
  • Traffic2money.com (Novo- adicionado em 28 de julho de 2015 - Suspeito)

Nota: Itens suspeitos - parecem seguir o mesmo padrão de propriedade e não podem estar vinculados ao mesmo infrator.

Uma lista bastante exaustiva de referenciadores de spam mantidos pelo Piwik pode ser encontrada aqui: https://github.com/piwik/referrer-spam-blacklist/blob/master/spammers.txt (Obrigado - user2428118)

Citar:

O BlackHatWorth.com é um domínio relativamente novo, criado apenas em 7 de janeiro de 2015, que agora está sendo usado para spam de referência. Por uma questão de fato, este site de spam de referência está sendo escondido atrás do nome do mecanismo de pesquisa de compras e de belas imagens de paisagens.

... o endereço IP do BlackHatWorth.com 78.110.60.230 é o mesmo associado a outros sites de spam de referência ...

De fato, o domínio BlackHatWorth.com é de propriedade do mesmo russo que é dono de outros domínios de spam de referência, como ILoveVitaly.com, Econom.co e Darodar.com. O nome do proprietário do domínio é Vitaly A Popov de Samara (cidade), Samaraskaya Oblast (estado), Rússia.

Você não pode bloquear isso!

De: http://www.blackmoreops.com/2014/12/19/darodar-com-referrer-spam/

Citar:

Aqui está uma rápida introdução sobre como o Google Analytics funciona.

Então, você configura o GA e obtém um código deles. O código parece UA-número-1 ou algo parecido. Esse número é o seu "número da conta" no GA. Agora, esse código e um pouco de javascript vão para a sua página da web. Agora, alguém visita sua página e o navegador executa esse código javascript.

Esse código javascript é o que "registra" sua visita. Isso faz o navegador falar com o Google Analytics. Especificamente, ele faz certos tipos de solicitações HTTP sobre as quais o Google registra informações e o GA exibe resumos dessas informações para você.

Bem básico, certo? Ainda comigo? Ok, agora, se tudo isso é Javascript enviando a "visita" a eles, qualquer um pode fingir. Alguém mesmo. Tudo o que preciso fazer para que seu GA mostre informações falsas é enviar minhas informações falsas diretamente para o GA.

Não preciso visitar seu site. Não preciso executar javascript. Eu só preciso reproduzir essas solicitações HTTP, que são públicas e para que qualquer pessoa possa vê-las e como elas funcionam. Eles são até bem documentados publicamente pelo próprio Google.

Então, agora, digamos que eu seja um imbecil de spam. Quero que as pessoas vejam meu site com spam. Então o que eu faço? Escrevo um pequeno pedaço de código para enviar milhares e milhares dessas solicitações falsas para o GA e simplesmente percorro todos os números da UA, em ordem, aleatoriamente, seja o que for. Envio uma visita falsa, com um referenciador falso, e meu nome de domínio com spam. E adivinha? Ele aparece nas telas do Google Analytics.

Você vê esse spam como qualquer outra visita normal. Porque, no que diz respeito ao GA, foi uma visita normal. Tudo o que estão gravando são as solicitações HTTP, que normalmente vêm do código javascript do GA. Mas um pedido é um pedido, e fazer um pedido falso é muito, muito fácil.

É isso que está acontecendo. Tudo o que preciso é do seu número de UA e, com apenas um pouco de esforço, posso falsificar uma visita ao seu site sem realmente conectar-me ao seu site. Essa visita falsa pode ter qualquer nome de domínio e qualquer referenciador que eu escolher.

Este é um ataque ao Google Analytics, para promover qualquer site que esteja aparecendo. Você não pode bloqueá-lo no seu servidor, porque o servidor não está envolvido.

Você pode fazer duas coisas: uma, configurar um filtro, como sugere John Conde; e dois, veja se existe uma maneira de informar o Google. Para isso, não tenho resposta, mas tenho uma ideia.

[Atualizar]

Isso está começando a atingir proporções ultrajantes de centenas de acessos de spam por dia a publicidade completa como esta:

insira a descrição da imagem aqui


2
@JohnMueller Isso não está dentro do seu reino, mas você pode enviar alguns e-mails para ver se G tem conhecimento disso? Desde já, obrigado!!
closetnoc

2
@JohnConde Thanks! John Mueller pode não saber disso, mas alguém em G deveria. Mesmo se não houver resposta, pelo menos G deve ter um aviso, se ainda não o tiver. É a coisa certa a fazer por todos nós. Felicidades!
Closetnoc

1
@JohnConde BTW- Vi perguntas sobre isso em outros sites da SE (e possivelmente relacionados). Eu não tomei notas, mas existe uma boa maneira de transmitir uma nota para os outros Mods? Ou devo apenas procurar no Google esses nomes de domínio e procurar respostas e postar?
closetnoc

1
@joelmdev Você perdeu o ponto em que estes não podem ser bloqueados. Este é um ataque direto ao Google. Ninguém tem nenhum controle, exceto o Google. Eles foram notificados e pararam na maior parte do tempo.
Closetnoc

2
@ Steve Não vejo que haja uma grande recompensa, no entanto, tem que haver uma em algum lugar. A pessoa mencionada na resposta odeia o Google e provavelmente quer envergonhar o Google, no mínimo. Mas eles também estão usando claramente esse spam para direcionar tráfego para vários sites que continuam sendo registrados. Eu já vi algo parecido com um anúncio usando esse método. É chato como o inferno !! Está machucando pessoas inocentes mais do que o Google realmente. Presumo que funcione ... muito triste.
Closetnoc 29/05

5

Você pode excluí-los criando um filtro . Você precisa encontrar algo específico o suficiente para não bloquear acidentalmente bons visitantes e é entediante, pois você deve adicionar manualmente cada remetente de spam, mas isso fará o truque.


Você tem algum conselho do IIS que possa ajudar? Eu posso ajudar com o Apache, mas o OP parece ter o IIS.
closetnoc

2
Se eles não estão acessando o site, como acredito que eles disseram, esse não seria um método eficaz de bloqueá-los. Ou eu li a pergunta errado?
John Conde

Eu li como o OP está sendo atingido com spam de referência.
closetnoc

2
De fato, mas aparentemente eles estão acessando o GA diretamente, em vez de acessar o site. It seems these spammers are using scripts to spam directly to GA (i.e. they are not logged in my IIS).
John Conde

OK. Você está certo. Minha culpa!! Não sei por que não o compreendi porque estava lendo sobre isso antes da pergunta. Também estou sendo atingido por spam de referência e um artigo mencionou (brevemente) que não havia entradas em seus arquivos de log. Novo método interessante.
closetnoc

4

Para responder diretamente à pergunta do título "Como combater os remetentes de spam de referenciadores", a resposta mais simples é deixar o Google Analytics e mudar para o Piwik , que bloqueia automaticamente todo o spam de referenciadores por padrão .

Sei que você provavelmente está acostumado ao Google Analytics e deseja continuar usando-o, mas se você olhar para a foto maior, terá outra opção que funcionará muito bem. O Piwik também pode ser configurado para registrar os endereços IP dos visitantes, se você preferir, e não vaza dados dos visitantes para empresas de publicidade de terceiros, o que pode atrair alguns usuários.


2
Pela forma como a lista negra referrer spam que Piwik usa é open source: github.com/piwik/referrer-spam-blacklist
Matthieu Napoli

o banco de dados de spam é bem pequeno. nem mesmo os domínios mencionados no meu relatório de análise.
Don Dilanga 9/01

1

Aqui está uma regra que funciona no IIS:

<rewrite>
  <rules>
    <rule name="abort referer spam requests" stopProcessing="true">
      <match url=".*" />
      <conditions>
        <add input="{HTTP_REFERER}" pattern="(semalt\.com)|(buttons\-for\-website\.com)" />
      </conditions>
      <action type="AbortRequest" />
    </rule>
    <!--The rest of your rules, if you have any-->
  </rules>
</rewrite>

2
Essa resposta não tem nada a ver com a pergunta da OP, pois os spammers estão enviando spam diretamente ao Google Analytics, ignorando o servidor da Web da OP.
Alfred Myers

@AlfredMyers Seu comentário é parcialmente verdadeiro, já que alguns remetentes de spam usam o método de servidor da web, outros usam o método direto, como você mencionou. Neste último caso, a única solução é adicionar filtros no Google Analytics para obter relatórios limpos. Para evitar isso, prefiro que o Google use um identificador exclusivo com hash mais longo para contas do GA, para que os remetentes de spam não possam simplesmente percorrer os números disponíveis e acionar consultas.
Flo

O OP afirma especificamente "... esses spammers estão usando scripts para enviar spam diretamente para o GA (ou seja, eles não estão conectados no meu IIS).". Portanto, para esta pergunta específica, eles não estão acessando o servidor da web.
Alfred Myers

1

Caso você ainda esteja procurando uma solução e não consiga entender as referências feitas, aqui está o Guia Definitivo para Remover Spam de Referências, agora em sua 133ª revisão desde 28 de dezembro de 2014: http://www.analyticsedge.com/2014 / 12 / remove-referral-spam-google-analytics /

TL; DR:

  • um filtro de nome de host válido removerá todas as referências fantasmas (incluir nome do host meudomínio.com)

  • um filtro de exclusão específico (ou bloqueio de site) removerá uma lista muito mais curta de rastreadores de spam (semalt.com | kambasoft.com | 7makemoneyonline.com | best-seo-offer.com | best-seo-solution.com | buttons-for -website.com | buttons-for-your-website.com | -musicas * -gratis | anticrawler.org | savetubevideo.com | ranksonic)

  • um segmento avançado pode ser usado para removê-los dos seus relatórios históricos.

O segmento avançado pode ser importado da Galeria de soluções do Google Analytics: https://www.google.com/analytics/gallery/#posts/search/%3F_.sort%3DDATE%26_.start%3D0%26_.type%3DADVANCED_SEGMENT % 26_.viewId% 3DGjpPQhFgS9aVzniXH4MTIg /


0

No início do ano passado, fui encarregado de encontrar a melhor solução possível para o spam do Google Analytics. Como todo mundo, tentei as abordagens recomendadas, mas nada parecia funcionar tão bem. Então, em seguida, virei para o Gerenciador de tags do Google, mas isso também não pareceu ajudar muito. Frustrado e irritado, decidi reconstruir o script de rastreamento do Google Analytics, incorporando contramedidas contra as formas mais comuns e irritantes de spam.

Embora não seja perfeito, depois de aproximadamente 1,5 anos construindo, testando, depurando e refatorando, agora tenho um script de rastreamento do Google Analytics bastante confiável que funciona bem e é facilmente personalizável. Para aqueles que querem métricas satisfatórias, isso funciona como um encanto.

https://github.com/nickolasburr/intelligent-ga-tracking

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.