Uma página foi removida do Google devido ao DMCA. Seus links de entrada ainda são valiosos?

Ok, aqui está o que eu acredito que é uma pergunta complicada:

Portanto, você tem um site em que uma remoção de DMCA foi feita contra uma postagem, que recebeu uma quantidade enorme de tráfego, a remoção de DMCA pode ou não estar correta, mas não tenho tempo nem recursos para combatê-la no momento.

Minha pergunta, a página que foi emitida com a remoção do DMCA foi ocultada dos SERPS, mas a postagem ainda permanece no meu blog - porque recebeu uma quantidade tão grande de tráfego que gerou uma quantidade considerável de backlinks de alta qualidade. .. assim, o que acontece com esses backlinks, a página ainda está no site, mas removidos (ocultos) no banco de dados do google, os backlinks ainda carregam peso ...?

EDIT 1: Ao fazer uma pesquisa no google pelo link, o seguinte é exibido:

Em resposta a uma reclamação que recebemos de acordo com a Lei de Direitos Autorais do Milênio Digital dos EUA, removemos 1 resultado (s) desta página. Se desejar, você pode ler a reclamação DMCA que causou as remoções em LumenDatabase.org.

EDIT 2 O site antigo de onde a postagem teve origem há meses e ainda tem um rel canonicalapontamento para a postagem do blog no meu site, agora emitida com DMCA ... No entanto, rel canonicalela foi ignorada desde que foi emitida com DMCA, embora os rel canonicalrestos apontados para o meu site ... pelo que vale a pena

— Timothy Coetzee
fonte

Sua segunda edição me faz pensar (eu odeio isso). Você é o autor original do post? Se for esse o caso, como o outro site afirma que você roubou o conteúdo deles? Algo a considerar.

— Closetnoc 29/09/16

@closetnoc Eu escrevi o post, era um negócio em que meu parceiro (anterior) e eu tínhamos um site, concordamos em dividir, e eu levei meu post para o meu novo site, ele concordou em colocar um rel canonicalno meu novo site para o post que escrevi .... Algumas coisas aconteceram abaixo da linha, em suma - ele notou que o post que escrevi (originalmente publicado em nosso domínio compartilhado), começou a gerar uma quantidade enorme de tráfego, ficou azedo e registrou um DMCA contra a publicação, (a publicação recebeu mais de 100 mil compartilhamentos sociais e foi mencionada em algumas publicações importantes) Você acha que é plágio ... com base nas explicações acima?

— Timothy Coetzee

Plágio não é a palavra. No entanto, se uma queixa falsa de DMCA for registrada, eu lutaria sem hesitar. Isso é "juramento falso" nos termos da lei. Isso é um crime. Explique a eles o que você nos explicou. Aconselho a contratação de um advogado de direitos autorais para escrever uma ou duas cartas, uma cessar e desistir de seu ex-parceiro e a outra em um esforço para combater isso. As cartas são baratas e geralmente resolvem os problemas rapidamente. Por alguma razão, quando um advogado se envolve, as pessoas começam a levar as coisas a sério. Não significa um processo, apenas o mínimo que você pode fazer para garantir a vitória.

— Closetnoc 30/09/16

Respostas:

OK. Esse será um daqueles casos em que vou trabalhar no processo para que fique mais claro. Vai demorar um pouco, mas espero que não seja dolorosamente longo.

Vamos começar do começo, vamos?

Começando com o que sabemos sobre como o Google funciona com base originalmente no trabalho de pesquisa de Brin e Page em 1997, sabemos algumas coisas que provavelmente ainda estão em jogo atualmente.

O Google tem um URL no índice e busca na fila e busca a página. O código da página é armazenado em seu banco de dados para várias formas de processamento. Um dos processos seria encontrar novos links. Qualquer link encontrado pelo Google será localizado primeiro no índice do link, se existir. Caso contrário, o link será adicionado à tabela de links e adicionado à fila de busca.

Qualquer link na tabela de links possui pelo menos esses elementos, o URL do link, o URL de origem e o texto do link. É provável que existam outros elementos de dados, no entanto, estes não avançam na discussão. Qualquer link adicionado à tabela de links verificou o URL de origem, mas não necessariamente o URL de destino. Usando bancos de dados relacionais como exemplo, os URLs de origem e de destino podem ser um ID de URL na tabela de URLs e uma tabela de junção unirá os elementos de URL de origem e de URL de destino da tabela de links usando um ID de volta à tabela de URLs. Confuso? Não seja.

Para qualquer caso em que a página de destino não tenha sido buscada, o link na tabela de links é considerado um link pendente. Depois que a página é buscada, o link na tabela de links está completo. Se a página de destino não existir, o link na tabela de links será um link quebrado. Simples?

Somente links completos podem passar valor. O algoritmo PageRank requer um link completo para calcular o valor. Todos os links danificados e quebrados interrompem qualquer cálculo usando o link. Anteriormente, o PR era um processo recursivo que calculava os valores dos links usando a tabela de links repetidamente até que o valor que pode ser ajustado a qualquer link caia dentro de um valor numérico tão pequeno que efetivamente não fará diferença. Estou certo de que isso ainda ocorre como um processo de manutenção da casa. No entanto, hoje o PR é calculado usando outro método semelhante ao do lúpulo em uma rede que mede a distância de uma página para outra com importância relativa. É baseado no modelo de rede confiável, que é como o modelo original do PageRank foi projetado para emular. Um link é um voto de confiança de uma entidade para outra. Embora fique mais complicado que isso, você entendeu a foto. Ele efetivamente faz a mesma coisa que o processo recursivo, usando um cálculo em tempo real, embora provavelmente seja menos preciso, mas preciso o suficiente para ser confiável. Isso requer links completos, pois os valores de confiança (usando o modelo de rede confiável) não podem ser transmitidos se a confiança não for estabelecida. Lembre-se de que um link é um voto de confiança ou link no modelo de rede confiável. PageRank é representado como um valor confiável em uma rede confiável.

Agora que você entende os links e a importância deles, vamos seguir em frente.

Para um mecanismo de pesquisa, não faz sentido remover nenhum URL. Se um URL não existir na tabela de URLs, você não saberá nada sobre o URL e poderá ficar sem saber. Os URLs provavelmente não serão excluídos geralmente, a menos que faça sentido, por exemplo, se o URL não existir mais. No entanto, quando uma página é definida como NOINDEX, o mecanismo de pesquisa foi instruído explicitamente para NÃO indexar a página. Como uma página da Web no índice consiste em duas coisas, uma URL e o código-fonte HTML, o NOINDEX remove efetivamente a página neste momento. Os links para uma página NOINDEX estão pelo menos dangling.

Agora que você sabe como é uma página indexada, vamos mais adiante.

Há muitas maneiras pelas quais um mecanismo de pesquisa penaliza uma página da web ou site. Um está saindo da lista. Esta é a mais severa de todas as penalidades e leva muito tempo para se recuperar. Você pode comprovar esta categoria de penalidade, pois a página não será e não poderá ser encontrada. Além disso, o Googles Search Console, de maneira geral, informará que as páginas estão sendo excluídas. Das demais penalidades, as penalidades são aplicadas nos filtros SERP.

Quando uma consulta de pesquisa é executada, na verdade existem várias consultas no índice de uma só vez que são combinadas em um conjunto de resultados com base em uma parte do algoritmo. O algoritmo restante, ao qual frequentemente nos referimos como uma entidade única, é uma série de algoritmos SERP relativamente simples. Os algoritmos principais dos quais reorganizarão o conjunto de resultados com base em métricas em tempo real, como tendências. Dos algoritmos, aqueles que removem entradas do conjunto de resultados ou reduzem seriamente o posicionamento de uma entrada no conjunto de resultados são chamados de filtros. Um aplicado é o filtro que lida com DMCA, como evidenciado com...we have removed 1 result(s) from this page...

Então agora que você sabe como as multas são aplicadas, os links, os PR e os filtros DMCA estão conectados?

Com isso, sabemos que um filtro foi aplicado; no entanto, isso não tem nada a ver com o índice de links, que é como o PageRank é calculado. Está o mais longe possível do processo de link / PR. Os links e o PR estão no início do processo de indexação, enquanto a remoção da página penalizada pelo DMCA está no final do processo de consulta. De fato, esses são dois mecanismos completamente separados. Portanto, embora uma página possa ser removida devido a uma reclamação da DMCA, ela não é realmente removida do índice e, portanto, os links para e da página ainda são calculados.

Claro como lama? Espero ter explicado isso bem. Informe-me se puder esclarecer algo para você.

[Atualizar]

Uma exceção que não se aplica ao cenário do OP.

O @StephenOstermiller traz um bom ponto que não prejudica o acima exposto, no entanto, gostaria de adicioná-lo por completo.

Como você sabe, a pontuação de um site ou página na pesquisa requer muitos fatores. Embora isso não seja tão técnico ou místico como você possa imaginar, ainda há muitos fatores a serem considerados. Esqueci o efeito das pontuações de confiança principalmente porque não se aplicava ao caso do OP. Então, eu estou adicionando aqui.

Claramente, existem sites que não são bons, como sites de spam. Dentro dessa classificação de sites, existem sites que abusam habitualmente do conteúdo de direitos autorais. Esse foi um grande problema há muitos anos, em que os raspadores de conteúdo construíam sites fora do seu trabalho duro. Durante muito tempo, nada foi feito. Os sites com conteúdo original perderiam para os sites de raspador de maneira bastante consistente. Eu deveria saber. Eu tinha dois sites de PR 8 que perderam quase todo o tráfego devido a sites de raspadores sem absolutamente nenhum recurso.

No entanto, as coisas mudaram. E faz apenas quatro anos desde que as mudanças significativas começaram.

Para essas classificações especiais de sites, a pontuação de confiança dos sites pode ser significativamente reduzida. Isso é bem conhecido. Demora anos para reconstruir as pontuações de confiança e, para alguns sites, isso pode nunca acontecer. Por que, por exemplo, você acha que os monetizadores de domínio estão tão dispostos a destruir completamente um site com centenas de milhares de pessoas esperando pelo mesmo abuso? É porque a realidade é que um domínio pode arruinar seu valor além da redenção.

Existem muitos fatores que estabelecem a confiança. Eu não vou entrar nisso aqui. No entanto, saiba que a confiança é um componente importante na construção de rankings para qualquer site.

Dito isto, para qualquer site que seja um violador grave da DMCA com um histórico bastante extenso, sofrerá uma séria batida em sua pontuação de confiança. Este não é o cenário que o OP está descrevendo. No entanto, é o cenário que estou assumindo aqui.

Os links e o estabelecimento do PageRank têm mais de um componente. Um deles é o PageRank (autoridade) da própria página. Para páginas altamente autorizadas, há um limite de autoridade. Uma página de RP 8 não compartilhará um valor de 8 entre os links dessa página. Isso faz parte do algoritmo PageRank original destinado a colocar uma curva mais natural no PR. Caso contrário, seria quase impossível para uma nova página competir contra uma página com alta autoridade, mesmo após um longo período de tempo. O valor do link em si é classificado usando vários fatores, incluindo o valor semântico do texto do link, o URL do link, a localização do link (destaque), o valor semântico do bloco de conteúdo que contém o link, se aplicável, etc. Todos os links são pontuados de 0 a 0,9. O cálculo da pontuação da autoridade e do link é o valor passado por qualquer link.

Bem e bom. Então, como isso afeta um site que é um violador significativo do DMCA?

O valor de qualquer link de entrada não seria necessariamente afetado pela pontuação de confiança do site de destino, uma vez que o valor dos links vem do site de origem. No entanto, qualquer link de saída pode ser. A autoridade de qualquer site que seja um abusador significativo da DMCA seria afetada pela pontuação de confiança. Afinal, a autoridade vem da confiança. Portanto, dessa maneira, o valor de um link de entrada não seria passado pelos links de saída sem ser degradado, dependendo da pontuação de confiança.

Isso muda a resposta um pouco.

Embora não se aplique ao cenário do OP, existe um cenário em que um valor de link de entrada não é passado completamente pelo site com uma violação de DMCA. No entanto, este é um caso difícil e, portanto, o limite antes que isso aconteça é significativo.

— closetnoc
fonte

muito obrigado por esta resposta detalhada ... Vou manter isso aberto por mais alguns dias para ver o que mais pode surgir ... Vou fazer um pouco mais de pesquisa e vou fazer algumas perguntas antes de aceitar a resposta em dia seguinte ou dois, se está tudo bem - mais uma vez obrigado por tomar o tempo para escrever isso tudo

— Timothy Coetzee

O Google reduziu as solicitações de DMCA para ser um fator de classificação: searchengineland.com/… Esse algoritmo direcionou muitas solicitações de DMCA em vez de apenas uma, como no caso desta pergunta. É possível que a desvalorização dos links para páginas suprimidas pelo DMCA possa ter feito parte dessa atualização do algoritmo. Como na maioria das coisas, o Google não está dizendo. Também não conheço uma boa maneira de testá-lo.

— Stephen Ostermiller

Mas eu concordo com o closetnoc que o Google teria que escrever um código para desvalorizar especificamente esses links, porque o DMCA se encaixa no processo de indexação.

— Stephen Ostermiller

@StephenOstermiller Sim. Eu esqueci disso. Basicamente, o mecanismo de índice estabelece métricas de classificação, incluindo links com domínio e métricas de confiança, enquanto outras entidades podem rebaixar a classificação. Os filtros SERP são dinâmicos. O que é mencionado no artigo parece ser uma categoria inteira de violações persistentes que degradam a classificação de confiança dos sites. Se um site recebe uma batida na confiança, é muito difícil recuperá-lo. Isso pode levar anos. Uma classificação de confiança de sites pode afetar o valor de um link de saída. Quando estiver mais cafeinado, vou ver se consigo entender isso na resposta. Obrigado por trazer isso à tona! Felicidades!!

— Closetnoc 03/10/16

@StephenOstermiller A parte que eu tenho que pensar é se a pontuação confiança vai afetar o valor de um link de saída. Eu imagino que sim, mas ainda não tenho certeza de como isso funcionaria. Eu teria que pensar um pouco sobre isso. Certamente não afetaria o valor de um link de entrada que eu possa ver. Ant é a parte que afeta o OP.

— Closetnoc

HAHA Acho que compreendo perfeitamente essa questão agora: /

Foi VOCÊ quem recebeu o aviso, o link para o SEU site está oculto na pesquisa do GOOGLE, o ARQUIVO ainda está no SEU site e existem muitos OUTROS LINKS que apontam para o SEU site, e esses links têm peso no SEU site ao mostrar no GOOGLE com link para o SEU site E os LINKS têm as informações de aviso omitidas na parte inferior da pesquisa do Goggle. : P Estou certo?

À luz disso -

Minhas respostas originais teriam sido de grande ajuda para as pessoas que preencheram os avisos de remoção da DMCA OH! -drumroll

Então aqui está a minha resposta: Não e inferno NÃO!

Esses links específicos são basicamente não confiáveis e você deve estar preocupado com o fato de eles ainda vincularem ao seu site. Você também pode fazer a negação e se proteger. Sério.

Além disso, devem ser os outros proprietários do site que devem estar mais preocupados e por que a auditoria de seus backlinks pode ser muito importante. Um histórico desse tipo de associação em que o autor está postando esses tipos de links terá efeitos negativos sobre eles.

Você pode avisar as outras pessoas que elas têm links de conteúdo ruins apontando para VOCÊ e possivelmente machucando-as.

Honestamente, esse tipo de conteúdo não vale a pena ter para você ou eles e você nunca deve confiar nesses tipos de links para beneficiar seu SEO.

Decisões de curto prazo podem ter efeitos a longo prazo.

Fiquei me perguntando por que você continuava vazando informações um pouco de cada vez.

— norcal johnny
fonte

Obrigado pela sua contribuição ... Por favor, veja a resposta @closetnoc, acredito que seja uma descrição mais detalhada e precisa, não acho que você deva usar o disavow nesse caso. E certamente não descreverei os links como não confiáveis provenientes de sites PR8 + como TheIrishTimes, nzherald ...? Também tenha em mente o domínio onde o pós originou ainda está apontando um rel canonicalpara o meu site mesmo que ele não é mais honrada por causa da notificação DMCA ...

— Timothy Coetzee

Pergunta interessante. Na minha opinião, nenhum patrimônio será passado pelos backlinks, pois a página não será rastreada ou indexada pelo Google, pois foi removida do banco de dados. Acredito que o Google ainda rastreia páginas da Web que não são indexadas, no entanto, não tenho certeza se isso difere quando uma página é removida do banco de dados do Google, mesmo que ainda esteja no site.

— Sean Lloyd-Clarke
fonte

Você está precisamente certo. O link seria um link danificado, não um link quebrado e nenhum valor pode ser passado, pois a página não existirá no índice. Isso inclui links da página que não está indexada. Alguns dizem que essas páginas existem mesmo que não sejam exibidas nas SERPs para que os links possam ser calculados. Isso pode ser parcialmente verdade. Só porque uma página não está indexada, não significa que a página não foi buscada e os links não são calculados. Isso ainda é possível. No entanto, suponho que G não trabalhe tanto e possa viver com uma interrupção na cadeia. Até o debate.

— Closetnoc 27/09/16

Olhe a página definitivamente existe e o Google sabe disso, pois se você fizer uma pesquisa exata, obterá que o

In response to a complaint that we received under the US Digital Millennium Copyright Act, we have removed 1 result(s) from this page. If you wish, you may read the DMCA complaint that caused the removal(s) at LumenDatabase.org.

Google saiba disso, então não é impossível que os links tenham peso ...?

— Timothy Coetzee

@ TimothyCoetzee Se você pode encontrar a página nos SERPs, sim, os links contam. ... removemos 1 resultado (s) desta página ... é uma dica. Este é um filtro SERP; portanto, a página existe e os links são contados. Felicidades!!

— Closetnoc 28/09/16

Por que a página não seria rastreada? Eu não esperaria que o Google parasse de rastrear conteúdo que foi removido do mecanismo de pesquisa devido ao DMCA.

— Stephen Ostermiller