A contagem de palavras é um fator de classificação?
Não. Absolutamente não!
Qualquer sugestão de que a contagem de palavras seja um fator de classificação é um SEO ruim e completamente errado. De fato, é um insulto ao Google e ao Bing sugerir uma coisa dessas.
Não há limite, curto ou longo, ou mesmo um intervalo que influencia a pesquisa, exceto o ridículo. O conselho para criar conteúdo de alta qualidade permanece. Conteúdo curto e conciso, se bem feito, é perfeitamente adequado.
Olhando para a pergunta logicamente.
O Google usa uma regra para determinar os fatores de classificação. O fator pode ser manipulado para aumentar artificialmente o desempenho da pesquisa?
A contagem de palavras pode ser manipulada? Em uma palavra, sim. Claro. Se a contagem de palavras fosse um fator de classificação, o conteúdo seria longo e consistente na maioria dos sites para obter classificação. Isso não foi feito. De fato, o conteúdo mais curto pode classificar muito bem. Isso é evidente para quem pesquisa no Google por qualquer período de tempo.
Com exceção dos extremos, conteúdo extremamente curto ou extremamente longo, o tamanho do conteúdo não afeta o desempenho. Existem muitos fatores envolvidos na indexação e avaliação do conteúdo para que o tamanho do conteúdo tenha algum efeito, se for o caso. O fato claro da questão é que o comprimento do conteúdo seria, pelo menos, uma métrica tão insignificante, se usada, em comparação com outras que importam.
Aqui está outra regra que o Google usa para determinar um fator de classificação. O que a métrica diz sobre o conteúdo? Por exemplo, a qualidade do conteúdo ou como o conteúdo deve ser encontrado etc. O comprimento do conteúdo literalmente não diz nada sobre o conteúdo em si. Mais uma vez, com exceção dos extremos, o comprimento do conteúdo não pode ser usado logicamente para indicar a qualidade do conteúdo, como o conteúdo deve ser encontrado, a popularidade do conteúdo etc.
Correlação à parte, supondo que exista alguma correlação a ser discutida, o comprimento do conteúdo como uma métrica não oferece nenhuma regra definitiva a ser feita. Conteúdo longo pode ser tanto lixo quanto valioso. O mesmo existe para conteúdo mais curto. Pergunte a si mesmo: sob que conjunto de regras o tamanho do conteúdo pode indicar definitivamente a qualidade, o valor, a popularidade, etc.? Você não poderá encontrar um.
Para acertar.
Alguns anos atrás, ao pesquisar fatores de confiança para um projeto de pesquisa de sistemas de segurança para a NSF em que eu estava trabalhando, o Google compartilhou alguns documentos internos que detalhavam o esquema do banco de dados, algoritmos, lógica de negócios etc. O motivo para compartilhar o documento era simples. Há uma grande sobreposição entre os fatores de confiança de domínio que o Google usa e os que estávamos desenvolvendo para determinar a confiança no domínio na Internet, e o Google queria ver se havia algum novo fator em desenvolvimento e quais experiências estatisticamente ajudariam a determinar como o Google determina a confiança no domínio. fatores.
Com base nesses documentos, em nenhum lugar havia nenhuma métrica ou algoritmo que abordasse o tamanho do conteúdo. Isso vale repetir. A duração do conteúdo não é um fator de classificação ou mesmo um fator.
De onde vem a noção de contagem de palavras?
Principalmente de blogueiros de SEO. Os blogueiros de SEO, na maioria das vezes, não estão familiarizados com o uso da tecnologia na pesquisa. Muito do que é postado é repetido de outras pessoas ou anedótico. Muito poucos realmente pesquisaram como a pesquisa funciona. Eles vão de sua própria experiência. No entanto, eles esquecem um fato simples. Conteúdo curto também pode ser extremamente bom.
O que o Google diz?
O Google tem muito a dizer sobre a satisfação de conteúdo. Muito do que é dito é puramente conceitual e projetado para consumo humano. Na verdade, não é como os mecanismos de pesquisa PODEM ver o conteúdo. Afinal, é uma máquina. Ele não pode avaliar o conteúdo da maneira que fazemos. A capacidade cognitiva de qualquer computador que usa inteligência artificial (IA) é extremamente baixa. Em vez disso, os mecanismos de pesquisa usam medidas científicas, muitas das quais datam dos anos 70. A análise semântica de vários tipos, redes de confiança, mapas de links, é uma tecnologia mais antiga na qual os mecanismos de pesquisa se baseiam fortemente. O que é usado são tecnologias e IA específicas para avaliar e apresentar ontologias em larga escala de informações textuais, algumas das quais foram construídas examinando como os humanos usam, processam e percebem a linguagem. Outros tratam do processamento de informações de maneira a permitir a recuperação de informações (RI).
Antes de começar.
Pensei em como discutir o desempenho do conteúdo sem entrar nas métricas? Eu olhei para a minha lista de métricas e é muito grande para este formato de perguntas e respostas. Então pensei em como não entrar nas tecnologias mencionadas acima? Mais uma vez, demais demais. Eu poderia escrever um livro! Em vez disso, explicarei algumas coisas que você talvez não tenha pensado. Vou manter simples. Estou trabalhando de memória.
Como o conteúdo é avaliado.
O conteúdo é avaliado por vários aspectos, dos quais força tópica, especialização, nível de leitura, mercado-alvo, declarações de fatos, estrutura semântica, análise de citações, etc., apenas para citar alguns.
A força tópica é a análise de termos-chave específicos encontrados em uma ontologia tópica para pontuar sobre os tópicos de um determinado texto. A força tópica é a pontuação de todos os tópicos, especialmente os relacionados, e o quão focado e completo um determinado texto está em um tópico específico.
Especialização é a análise de termos-chave específicos encontrados em uma ontologia tópica e análise de vínculo de fato que indica o nível de especialização que um determinado texto apresenta. Isso é comparado a outros escritos em que a experiência foi estabelecida. Isso requer pontuações comparativas com escritos conhecidos de especialistas sobre qualquer assunto. Por exemplo, seus escritos podem ser comparados aos trabalhos de pesquisa de um especialista conhecido. Nesse caso, o uso adequado de termos usando análise semântica, pontuações de força tópica, análise de vínculo com fatos e outras formas de avaliação indicará sua experiência em um tópico.
Nível de leitura é a análise do nível de educação necessário para entender um determinado texto. Embora, por um lado, isso seja auto-explicativo, verifica-se que pessoas altamente instruídas escreverão em um nível específico. Por exemplo, pessoas com doutorado costumam escrever para seus colegas. Isso indica um nível de educação e conhecimento não relacionado especificamente ao texto. Em vez disso, indicará para quem o texto está direcionado.
Mercado-alvo é a análise de mercados que indicam para quem um determinado texto deve apelar. Isso pode ser óbvio, no entanto, a análise de mercado é usada para corresponder uma consulta de pesquisa com mais precisão à intenção. Por exemplo, as consultas que parecem procurar conselhos de SEO se inclinam fortemente para o conteúdo centrado no SEO. As consultas de pesquisa que não são específicas o suficiente podem distorcer os resultados em um mercado inteiro facilmente.
Declarações de fatos é a análise que utiliza semântica para extrair declarações de fatos de um determinado texto e compará-las com declarações de fatos semelhantes em outro texto. Declarações de fatos que passam no exame minucioso e são aceitas se comparam favoravelmente na pesquisa. Por exemplo, o aniversário de George Washington é 22 de fevereiro de 1732. Se o seu conteúdo indicar o aniversário de George Washington como algo diferente, ele não será encontrado na pesquisa. As declarações de fatos são convertidas em links de fatos que compreendem o gráfico de conhecimento. O gráfico do conhecimento é simplesmente uma ontologia de fatos semeados com informações confiáveis. Para que qualquer fato seja adicionado ao gráfico de conhecimento, ele deve ser corroborado por várias fontes confiáveis. Quando uma declaração de fatos em seu conteúdo pode ser confirmada, o conteúdo recebe um link no gráfico de conhecimento (também conhecido como base de conhecimento) como uma fonte confiável para esse fato específico. Quanto mais declarações de fatos existirem em um determinado texto que possam ser corroboradas e vinculadas no gráfico de conhecimento, melhor o conteúdo do desempenho na pesquisa como factual.
A estrutura semântica é analisada e usada de várias maneiras. Uma das maneiras pelas quais a estrutura semântica é usada é criar fatos. Os fatos nem sempre são aparentes. Por exemplo, "Uma dúzia é 12." é aparente. Visto que "Brian tem um tio chamado Pete. Pete tem uma filha Diane", a estrutura semântica e a análise de fatos podem determinar que Diane é prima de Brian e vice-versa. Outra maneira de usar a análise semântica é analisar um determinado texto para obter conhecimentos linguísticos. Frases complexas, se estruturadas corretamente, podem ser entendidas e pontuadas adequadamente. Isso não apenas pode indicar conhecimentos sobre um determinado assunto, mas também permitir que existam relacionamentos complexos entre fatos.
Análise de citação é a análise em que citações e referências são encontradas para serem usadas em um determinado texto que se refere a outro texto. Isso geralmente ocorre na forma de uma citação, mas pode se referir a um título ou autor de um determinado trabalho que mostra um nível de conhecimento ou não. Citar um ou mais trabalhos autoritativos ajuda na pesquisa.
Por que eu mencionei tudo isso?
Porque todos eles influenciam a aparência do conteúdo de uma determinada pesquisa e se aplicam uniformemente, independentemente do tamanho do conteúdo. No entanto, a pontuação do seu conteúdo usando a análise mencionada influenciará a forma como o conteúdo é encontrado. Aqui estão as duas extremidades da escala.
O conteúdo mais curto tende a ser baseado em fatos e responde concisamente a uma única pergunta. Esse conteúdo funciona bem no mecanismo de resposta usando o gráfico de conhecimento. As consultas de pesquisa que solicitam uma resposta baseada em fatos geralmente resultam em conteúdo mais curto. Isso funciona melhor quando a pesquisa está tentando responder a uma consulta de pesquisa com uma resposta factual correta.
Conteúdo mais longo tende a ser fortemente baseado em fatos, com um alto nível de conhecimento. Isso geralmente não funciona bem no mecanismo de resposta. Por quê? Porque a resposta não é tão aparente. No entanto, para pesquisas mais acadêmicas, geralmente é encontrado conteúdo mais longo.
Existem exceções, é claro. No entanto, eu suspeito que eu fiz o meu ponto.
Então, por que os blogueiros de SEO entendem isso tão errado?
Porque a maioria das postagens em blogs de SEO são relativamente curtas e com pouca veracidade. Quais declarações de fatos existem muitas vezes não podem ser corroboradas por fontes altamente autorizadas, como documentos de pesquisa, e a maioria das declarações de fatos pode ser corroborada apenas entre outros blogueiros de SEO. Outras métricas de análise entram em jogo. A análise de perícia cai horizontalmente. O nível de leitura é moderado. Faltam pontuações tópicas. No entanto, a análise de mercado é forte. Com base na experiência dos blogueiros de SEO, o conteúdo dentro de uma janela de contexto relativamente estreita é criado e, portanto, é executado com base estreita no que é criado. Os blogs de SEO são escritos para um público que está procurando por pequenos pedaços de informação. A maioria das consultas de SEO não está em busca de uma única resposta baseada em fatos e, portanto, depende mais de outras métricas de pesquisa. As postagens mais longas tendem a se dar bem com mais declarações de fatos, porém, são muito estreitas no escopo tópico. É um fato consumado. Os blogueiros de SEO tendem a se reproduzir em uma grande câmara de eco e, portanto, poucas postagens oferecem algo novo ou perspicaz. Poucos já se referiram a obras autoritativas reais. É por isso que os SEOs me deixam louca. A maioria simplesmente não sabe como a pesquisa funciona.