Este é fácil. A densidade de palavras-chave é um mito- sorta. Pelo menos é agora.
O que é importante observar é como os termos são usados e não quantas vezes os termos são usados. Os SEOs gostam de confundir intencionalmente o problema para mantê-lo dependente deles e pagar por ferramentas e conselhos. PT Barnum costumava dizer que existe um otário nascido a cada minuto . Em SEO, a apresentação lateral parece ser todo o conselho online. Mais triste ainda, os SEOs se movem mais devagar que o PageRank, que é muito mais lento que a grama que cresce no Saara. Eles não saem dos conceitos antigos facilmente, mesmo quando estavam errados de início.
Este é um mini-tutorial sobre como os termos de um site são ponderados. Não é uma explicação completa, mas uma ilustração. É uma viagem que vale a pena fazer para entender melhor como o SEO funciona.
Antes de pesar termos e tópicos do site usando semântica, a ponderação de palavras-chave era realizada com alguns indicadores, incluindo o uso e o posicionamento de termos em tags como title
tags, tags de cabeçalho,description
meta tags, bem como proximidade entre si e tags importantes e outras indicações de importância, etc. Parte da indicação de importância foi o uso de termos, sinônimos, termos complementares e quão proeminentes esses termos pareciam ser. Isso segue um pouco a noção de densidade de palavras-chave e saiba que as proporções de termos foram aplicadas para determinar um tópico da página; no entanto, não foram as proporções altas ou baixas de termos, mas uma proporção que removeria efetivamente termos comuns, termos repetitivos e antinaturais uso de termos e termos que simplesmente não têm valor por falta de uso, etc. Esses índices de termos foram avaliados automaticamente página por página e os resultados combinados com cálculos que determinam se os resultados estavam dentro de um domínio operacional. Quando tudo foi dito e feito, os termos determinaram o tópico e o escopo do tópico usando a semântica descrita posteriormente. Mas a densidade não apresentava uma barra de classificação de pesquisa propriamente dita, mas um tópico e uma intenção de pesquisa correspondente. O efeito secundário é correspondido em termos de uma certa densidade por casualidade, pois os mesmos termos se encaixam em um perfil determinado através de links semânticos e foram usados para determinar a intenção de pesquisa. Isso seguiu o modelo do analisador, que em parte ainda existe, mas não é o modelo inteiro. Não mais.
A semântica é o modelo principal atualmente, embora, como a web siga um modelo de texto tradicional, o modelo do analisador não possa ser descartado inteiramente. A razão para isso é simples. Ainda se aplica e faz sentido e é muito útil.
A semântica pode ser descrita como "pareamento relacional", embora, para alguns modelos semânticos mais complexos, você esteja realmente falando de "cadeias relacionais". Isso é conhecido como links semânticos e o relacionamento entre os links semânticos é conhecido como a web semântica, que nada tem a ver com a world wide web, exceto que um é útil para o outro. Para minha ilustração, vou mantê-lo em pares simples, embora a semântica seja bastante complicada e rápida. Então, para minha ilustração, simplificarei bastante as coisas.
O emparelhamento relacional é a noção simples de trigêmeos; o sujeito, o predicado e o objeto. O predicado pode ser qualquer coisa, desde que seja representacional entre o sujeito e o objeto.
Vou desviar para um modelo inicial do PageRank. Por favor, fique comigo. Se aplica.
Quando o Google foi concebido, a noção de page rank era uma representação bastante simples de redes de confiança usando semântica. Um link é feito de uma página para outra. Nesse caso:
Subject: examplea.com
Predicate: trusts
Object: exampleb.com
Read as: examplea.com trusts exampleb.com
Subject: exampleb.com
Predicate: trusts
Object: examplec.com
Read as: exampleb.com trusts examplec.com therfore examplea.com trusts examplec.com
Embora saibamos que a cláusula "portanto" acima não é necessariamente verdadeira, esse foi o modelo inicial e ainda é verdadeiro, embora não seja absolutamente verdadeiro. Sabemos que examplea.com pode não ter conhecimento de examplec.com e, portanto, não podemos confiar inteiramente em examplec.com. Ainda assim, existe um relacionamento que deve ser considerado.
O uso antecipado do termo PageRank foi calculado em uma página por página - link por link, mas aplicado a todo o site. Para exampleb.com, quantos links de confiança existem? PageRank era um cálculo bastante simples dos links para as páginas de um site. Mas havia problemas óbvios com isso. É possível criar links para aumentar artificialmente a importância de um site. O cálculo continha uma taxa de decaimento bastante padrão que poderia corrigir isso, no entanto, a taxa de decaimento por si só trouxe novos problemas, pois nenhuma taxa de decaimento pode explicar completamente o valor real, já que sua inclinação natural é ter uma curva em seu cálculo.
Usando o modelo de confiança adicional, os domínios foram ponderados com base em fatores que indicaram confiança. Por exemplo, a maior métrica de confiança é a idade do site. Sites mais antigos geralmente podem ser confiáveis. Sites com registro consistente, endereço IP consistente, registrador de qualidade, rede de qualidade (host), não possuem histórico de spam, pornografia, phishing, etc. todos indicam confiança. Conto mais de 50 fatores de confiança do domínio, por isso vou ignorá-los e continuar mantendo-o simples.
Subject: examplea.com
Predicate: domain trust score
Object: 67
Subject: exampleb.com
Predicate: domain trust score
Object: 54
Subject: examplea.com
Predicate: trusts
Object: exampleb.com
Read as: examplea.com trusts exampleb.com
Usando outro cálculo, é possível obter algum nível de confiança e não apenas um site binário confia no outro . Onde o primeiro exemplo passou a confiança, o segundo exemplo passa um valor de confiança proporcional à forma como é calculado.
Agora, entenda que o PageRank é calculado página por página e o TrustRank é a maioria do SiteRank, dos quais links, qualidade e valor do link desempenham um papel, embora muito menos importantes do que originalmente e muito menos que a pontuação de confiança do site . Mantenha isso em mente.
Como isso se aplica às palavras-chave em uma página?
Todos os termos de conteúdo são ponderados, no entanto, apenas alguns termos de tag são ponderados. Um exemplo principal é a keywords
metatag. Todos sabemos que não há peso para os termos dessa tag. De fato, é completamente ignorado. Um equívoco é que a description
metatag não conta para o SEO. Isso não é verdade. Para os termos nessa tag, há peso, no entanto, é relativamente baixo. A meta-tag de descrição tem valor. Você entenderá o porquê daqui a pouco.
O antigo modelo de analisador ainda tem valor. Neste, a página é lida de cima para baixo e as tags e os blocos de conteúdo são lidos e ponderados usando valores que medem a importância seguindo um modelo de cima para baixo. Algumas métricas são estáticas. Por exemplo, a title
tag terá uma pontuação de importância maior que a h1
tag, que será maior que qualquer h2
tag, etc. A description
meta tag terá uma métrica de importância bastante alta. Por quê? Porque ainda é um indicador importante do que é a página. No entanto, os termos encontrados na tag têm pouco peso. Isso é feito para que as correspondências de intenção de pesquisa ainda correspondam à description
metatag quase tão facilmente quanto uma title
tag e umh1
, mas não pode ser manipulado com muita força para jogar no sistema. Observe que existem condições que podem ser aplicadas. Por exemplo, uma pesquisa não corresponderá à description
metatag sem corresponder em outro lugar principalmente à title
tag ou h1
tag ou no conteúdo.
Continuando com o modelo do analisador, imagine um ponto no início do conteúdo real. A proximidade é uma medida usada de várias maneiras. Um é onde um termo, tag, bloco de conteúdo etc. está em relação a esse ponto no início do conteúdo. Agora pense nas tags de cabeçalho como indicações de subtópicos e imagine um ponto no início do conteúdo imediatamente após uma tag de cabeçalho ser encerrada pela próxima tag de cabeçalho. Novamente, a proximidade é medida. A proximidade é medida entre os termos de um parágrafo, conjuntos de parágrafos,header
tags etc. Essas medidas são calculadas como peso dos termos em como são usados e de sua aparente importância. Indo além disso, termos, frases, citações e, de fato, qualquer parte semelhante do conteúdo podem ser medidos entre páginas e sites usando um modelo de proximidade um pouco diferente, mas ainda similar.
As páginas são relacionadas usando links de página para página e proximidade da página inicial ou de qualquer outra página em que uma nuvem de relacionamento possa ser determinada. Por exemplo, uma página de tópico em SEO pode ter links para várias páginas de subtópicos de SEO. Isso indicaria que a página de tópico para SEO é importante, pois está vinculada a várias páginas de tópico semelhantes e uma nuvem de relacionamento pode ser determinada. Portanto, para qualquer página de subtópico de SEO, a proximidade seria uma contagem dos links entre a página de tópico de SEO e a página de subtópico de SEO, bem como o número de links da página inicial. Neste, a importância das páginas pode ser calculada. Quão importante é a página de tópicos de SEO? É um link dos links de navegação na página inicial e, de fato, todas as páginas - muito importantes. Contudo, as páginas de subtópicos de SEO não possuem links da navegação e, portanto, ganham importância na métrica da página de tópicos de SEO. Isso segue o modelo de rede de confiança de link semântico PageRank.
Voltando ao modelo original do PageRank, você pode valorizar as páginas na forma como os vincula, assim como os links transmitem valor por toda a Internet. Isso é chamado de escultura, embora a escultura manipuladora excessiva possa ser determinada e ignorada, de modo que seja natural. Enquanto você faz isso, também indica a importância dos termos encontrados nestas páginas. Portanto, qualquer termo em qualquer página não é apenas ponderado sobre onde e como eles são usados nessa página, mas também a aparente importância da página em como e onde ela existe no seu site. Está começando a fazer sentido?
OK. Bem, mas como os termos estão relacionados e como a semântica ajuda nisso? Novamente, mantendo-o muito simples.
Eu tenho um site sobre carros. Você está no Reino Unido e tem um site sobre automóveis. É bastante óbvio que carros e automóveis são a mesma palavra. Os mecanismos de pesquisa usam um dicionário para entender melhor as relações entre palavras e tópicos. O Google se diferenciou criando um dicionário de auto-aprendizado desde o início. Eu não vou entrar nisso, mas você ainda vai entender. Usando semântica:
Subject: cars
Predicate: equals
Object: automobiles
Nisso, o Google pode descobrir que meu site e seu site são praticamente a mesma coisa. Indo um passo adiante.
Subject: car
Predicate: is painted
Object: dark red
Subject: automobile
Predicate: is painted
Object: maroon
Subject: deep red
Predicate: equals
Object: maroon
Supondo por um momento que apenas esses dois sites existam, qualquer pesquisa por automóvel vermelho escuro pode resultar em automóvel marrom e carro vermelho escuro, mesmo que o automóvel vermelho escuro não exista na Web.
Nos primeiros dias do SEO, era recomendável que sinônimos e versões plurais de termos fossem usados. Isso foi quando a semântica não era usada ou tão forte. Hoje, você pode ver que isso não é necessário, pois os relacionamentos entre palavras e uso são mantidos em um banco de dados semântico.
Usando o mesmo modelo, mas saltando um pouco à frente, se eu escrever uma peça brilhante citada em várias outras páginas da Web, a semântica pode notar isso como uma citação e atribuir isso de volta ao meu trabalho original, dando muito mais importância mesmo sem links para o meu página em tudo. Nesse caso, uma página sem links de entrada (voltar) pode ultrapassar uma página com um número alto de links de entrada (back) simplesmente por causa de uma citação. As citações são uma parte importante da aplicação da web semântica à world wide web. De fato, enquanto os SEOs estavam perseguindo o alusivo AuthorRank, não existia. Era tudo semântica e correspondência de pares de dados que não vou abordar, mas dizer que, por exemplo, escrito por poderia indicar o nome do autor imediatamente a seguir e, portanto, um crédito de citação pode ser aplicado ao autor se a peça foi citada.
Por que eu passei por tudo isso?
Para que você possa ver com facilidade, o mecanismo por trás da avaliação de qualquer termo em um site é muito mais complicado e não depende mais da densidade, que nunca foi totalmente o caso. De fato, a densidade não é mais um efeito secundário. A razão para isso simples. Era fácil de jogar e nenhuma taxa de decaimento poderia compensar o jogo, como no esquema original do PageRank.
Como em qualquer site cheio de palavras-chave, é apenas uma questão de tempo até que a semântica os denuncie. O Panda começou como uma tarefa periódica projetada especificamente para medir isso e outras coisas semelhantes e ajustar métricas para diminuir os efeitos de um site ofensivo nas SERPs. Embora o SiteRank geralmente permaneça o mesmo, qualquer site encontrado com spam sofrerá uma batida na pontuação do TrustRank por ter sofrido uma violação, diminuindo ligeiramente o SiteRank. Acredito que exista um componente de severidade nesse mecanismo que permita que pequenas ofensas sejam corrigidas sem danos. Essa batida continua mesmo quando o problema está resolvido. Isso ocorre porque a violação é mantida no histórico dos sites. Então, o que acontece é que o posicionamento do SERP cairá até que o problema seja resolvido, no qual o posicionamento do SERP começará a aumentar novamente, mas nunca no nível que o site ofensivo já teve devido à notação da violação. Quanto mais antiga a violação se torna, mais ela é perdoada, permitindo que uma ofensa anterior perca seu efeito negativo ao longo do tempo. Como uma observação, embora se diga que o Panda e outras pessoas correm com mais frequência e que seja um processo contínuo hoje, ainda leva tempo para construir o mapa de links semânticos para saber se um site é um infrator. Isso significa que um site se safará do preenchimento por um período, mas falhará no final assim que os links e métricas semânticas estiverem totalmente estabelecidos. Além disso, tenho certeza de que há um efeito inicial para o enchimento, mas diminui bastante usando o modelo semântico e o efeito é bastante superficial como um subproduto. Isso ocorre porque quando uma página é descoberta, resta pouco até que os mapas de links semânticos sejam preenchidos. O Google, em sua sabedoria, permite um pouco de graça, permitindo que a página tenha uma classificação alta para termos dentro dos sinais importantes inicialmente antes de se estabelecer em seu posicionamento adequado nas SERPs. Supondo que os sinais correspondam à semântica, o recálculo do posicionamento da SERP resultará em uma mudança relativa na forma como a página é encontrada. Caso contrário, se os sinais e a semântica não concordarem, o posicionamento no SERP será baseado na semântica e a forma como a página é encontrada será alterada. É por isso que é importante enviar os sinais certos em primeiro lugar, usando palavras-chave e tags com precisão e honestidade. permite um pouco de graça, permitindo que a página tenha uma classificação alta para termos dentro dos sinais importantes inicialmente antes de se estabelecer em seu posicionamento adequado nas SERPs. Supondo que os sinais correspondam à semântica, o recálculo do posicionamento da SERP resultará em uma mudança relativa na forma como a página é encontrada. Caso contrário, se os sinais e a semântica não concordarem, o posicionamento no SERP será baseado na semântica e a forma como a página é encontrada será alterada. É por isso que é importante enviar os sinais certos em primeiro lugar, usando palavras-chave e tags com precisão e honestidade. permite um pouco de graça, permitindo que a página tenha uma classificação alta para termos dentro dos sinais importantes inicialmente antes de se estabelecer em seu posicionamento adequado nas SERPs. Supondo que os sinais correspondam à semântica, o recálculo do posicionamento da SERP resultará em uma mudança relativa na forma como a página é encontrada. Caso contrário, se os sinais e a semântica não concordarem, o posicionamento no SERP será baseado na semântica e a forma como a página é encontrada será alterada. É por isso que é importante enviar os sinais certos em primeiro lugar, usando palavras-chave e tags com precisão e honestidade. recalcular o posicionamento do SERP resultará em uma mudança relativa na forma como a página é encontrada. Caso contrário, se os sinais e a semântica não concordarem, o posicionamento no SERP será baseado na semântica e a forma como a página é encontrada será alterada. É por isso que é importante enviar os sinais certos em primeiro lugar, usando palavras-chave e tags com precisão e honestidade. recalcular o posicionamento do SERP resultará em uma mudança relativa na forma como a página é encontrada. Caso contrário, se os sinais e a semântica não concordarem, o posicionamento no SERP será baseado na semântica e a forma como a página é encontrada será alterada. É por isso que é importante enviar os sinais certos em primeiro lugar, usando palavras-chave e tags com precisão e honestidade.
[Atualizar]
Recortei e colei esta resposta no TextRazor https://www.textrazor.com/demo e aqui está um exemplo. Você verá a posição relativa a esse ponto imaginário no início do conteúdo e outras análises linguísticas na tabela, bem como as pontuações dos tópicos à direita. Você pode fazer o mesmo cortando o texto desta resposta (acima desta atualização) e colando-o na página de demonstração e brincando um pouco. Eu encorajo isso. Isso lhe dará uma boa idéia de como o conteúdo é processado.