O que é conteúdo duplicado e como posso evitar ser penalizado por ele no meu site?


36

Esta é uma pergunta geral do wiki da comunidade sobre conteúdo duplicado.

Se sua pergunta foi encerrada como uma duplicata e você acha que as informações fornecidas aqui não fornecem uma resposta suficiente, abra uma discussão no Pro Webmasters Meta .


  1. O que o Google considera conteúdo duplicado?
  2. A maneira como estou apresentando meu conteúdo resultará em uma penalidade duplicada?
  3. Como evitar que o conteúdo do meu site seja tratado como conteúdo duplicado?

Respostas:


31

O guia para webmasters de conteúdo duplicado do Google define conteúdo duplicado (para fins de otimização de mecanismos de pesquisa) como "blocos substantivos de conteúdo dentro ou entre domínios que correspondem completamente a outro conteúdo ou são consideravelmente semelhantes".

O guia do Google continua a lista dos seguintes exemplos de conteúdo duplicado:

  • Fóruns de discussão que podem gerar páginas regulares e reduzidas direcionadas para dispositivos móveis
  • Armazene itens mostrados ou vinculados por meio de vários URLs distintos
  • Versões somente de impressora de páginas da web

Sanções

Os mecanismos de pesquisa precisam penalizar algumas instâncias de conteúdo duplicado, projetadas para enviar spam ao índice de pesquisa, como:

  • sites raspadores que copiam conteúdo por atacado
  • técnicas simplistas de fiação de artigos que geram conteúdo "novo" substituindo seletivamente as palavras no conteúdo existente.

Quando os mecanismos de pesquisa encontram conteúdo duplicado, eles podem:

  • Penalize um site inteiro que contenha conteúdo duplicado. (quando spam)
  • Escolha uma página como a fonte canônica do conteúdo e diminua a prioridade ou não indexe a outra página com a duplicação. (comum)
  • Não tome nenhuma ação punitiva e indexe várias cópias do conteúdo (raro)

Evitando duplicação interna

Quando perguntado sobre o conteúdo duplicado, Matt Cutts , do Google, disse que isso só deve prejudicá-lo se parecer spam , no entanto, muitos webmasters empregam as seguintes técnicas para evitar a duplicação desnecessária de conteúdo:

  • Verifique se o conteúdo está acessível apenas em um URL canônico
  • Se o seu site precisar retornar o mesmo conteúdo em vários URLs (por exemplo, para uma página "visualização de impressão"), especifique um URL canônico manualmente com um elemento de link no cabeçalho do documento
  • Nos casos em que seu site retornar conteúdo semelhante com base nos parâmetros codificados no URL (por exemplo, classificando um catálogo de produtos), exclua os parâmetros de URL nas Ferramentas do Google para webmasters

Organização de Conteúdo

A publicação de conteúdo em seu site que foi publicado em outro lugar é chamado de organização de conteúdo. Criar conteúdo duplicado por meio da organização de conteúdo pode ser bom:

  • Contanto que você tenha permissão para fazê-lo
  • Você diz a seus usuários qual é o conteúdo e de onde ele veio
  • Você vincula a uma fonte original (um link direto direto para o conteúdo original da página com a cópia, não apenas um link para a página inicial do site onde o original pode ser encontrado)
  • Seus usuários acham útil
  • Você tem algo a acrescentar a esse conteúdo, de forma que os usuários prefiram encontrá-lo em seu site do que em outros lugares. (Comentário ou crítica, por exemplo.)
  • Você também tem conteúdo original suficiente no site (pelo menos 50% do original, mas idealmente 80% do original)

Embora o Google não penalize todas as instâncias de conteúdo duplicado, mesmo o conteúdo duplicado não penalizado pode não ajudar você a receber visitantes:

  • Você está competindo com todas as outras cópias existentes
  • O Google provavelmente preferirá a fonte original do conteúdo e a cópia mais respeitável do conteúdo.

O Google penalizará o conteúdo duplicado publicado em seu site de outras fontes se:

  • Parece ser raspado ou roubado (especialmente sem atribuição).
  • Os usuários não reagem bem a isso (principalmente clicando no Google depois de visitar seu site.)
  • Existem tantas cópias por aí que não há razão para enviar usuários à sua cópia.
  • Sua cópia não é o original, mais respeitável ou mais utilizável; e não tem nenhum comentário ou crítica.
  • Seu site não possui conteúdo original suficiente para equilibrar todo o conteúdo republicado.
  • Você duplica as páginas com tanta frequência em seu próprio site que o Googlebot tem problemas para rastrear o site completo.

Internacionalização e segmentação geográfica

A localização de conteúdo é uma área em que a duplicação de conteúdo pode ser benéfica para o SEO. É perfeitamente bom publicar o mesmo conteúdo em sites direcionados a diferentes países que falam o mesmo idioma. Por exemplo, você pode ter um site nos EUA, um site no Reino Unido e um site na Austrália, todos com o mesmo conteúdo.

Com um site para cada país, geralmente é possível ter uma classificação melhor para os usuários daquele país. Além disso, é possível atender especificamente aos usuários em cada país com pequenas diferenças ortográficas, preços na moeda do país ou opções de envio do produto. Para obter mais informações sobre a configuração de sites com segmentação geográfica, consulte Como estruturar meus URLs para SEO e localização?

Lidando com Raspadores de Conteúdo

Outros sites que roubam seu conteúdo e o republicam sem permissão podem ocasionalmente causar problemas de conteúdo duplicado no seu site. Os mecanismos de pesquisa trabalham duro para garantir que seja difícil para os sites de raspadores se beneficiarem da duplicação do seu conteúdo . Se um site raspador estiver causando problemas para você, talvez seja possível remover o site do índice do Google registrando uma solicitação DMCA no Google


0

Em termos simples, o conteúdo duplicado é copiado de outras fontes da web ou do seu próprio site (o mesmo conteúdo em várias páginas).

O Google pode identificar facilmente se é um conteúdo exclusivo ou plágio.

É melhor escrever conteúdo por conta própria para o site e também não repetir o mesmo conteúdo em várias páginas.

Se o seu site tiver conteúdo duplicado, você não poderá estar na primeira página do Google e será penalizado pelas diretrizes do Google. Além disso, você não estará em 100 posições também no SERP.


A duplicata não precisa ser copiada de outras fontes. Também pode estar no seu site. Se mais de um URL puder veicular o mesmo conteúdo, independentemente de onde residia originalmente, será um conteúdo duplicado.
John Conde
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.