Atualmente, estamos desenvolvendo um site que possui atualmente 8 milhões de páginas únicas que crescerão para cerca de 20 milhões imediatamente e, eventualmente, para cerca de 50 milhões ou mais.
Antes de criticar ... Sim, ele fornece conteúdo exclusivo e útil. Processamos continuamente dados brutos de registros públicos e, ao fazermos uma limpeza de dados, rollups de entidades e mapeamento de relacionamentos, conseguimos gerar conteúdo de qualidade, desenvolvendo um site que é bastante útil e também único, em parte devido à amplitude do dados.
Seu PR é 0 (novo domínio, sem links), e estamos obtendo uma velocidade de cerca de 500 páginas por dia, colocando-nos em cerca de 30.000 páginas indexadas até agora. Nesse ritmo, levaria mais de 400 anos para indexar todos os nossos dados.
Eu tenho duas perguntas:
- A taxa de indexação está diretamente correlacionada ao PR e, com isso, quero dizer, está suficientemente correlacionada para que a compra de um domínio antigo com um bom PR nos leve a uma taxa de indexação viável (na faixa de 100.000 páginas por dia).
- Existem consultores de SEO especializados em auxiliar o próprio processo de indexação. Estamos de outra forma fazendo muito bem com SEO, em -page especialmente, além disso, a concorrência para o nosso "long-tail" frases-chave é muito baixo, por isso nossas dobradiças sucesso principalmente sobre o número de páginas indexadas.
Nosso principal concorrente alcançou aproximadamente 20 milhões de páginas indexadas em pouco mais de um ano, juntamente com o ranking Alexa 2000.
Qualidades notáveis que temos:
- a velocidade de download da página é muito boa (250 a 500 ms)
- sem erros (sem erros 404 ou 500 ao obter spidered)
- usamos as ferramentas para webmasters do Google e fazemos login diariamente
- URLs amigáveis no lugar
- Tenho medo de enviar sitemaps. Algumas postagens da comunidade SEO sugerem um novo site com milhões de páginas e nenhum PR é suspeito. Também há um vídeo de Matt Cutts no Google, sobre uma encenação encenada de sites grandes , a fim de evitar um maior escrutínio (em aproximadamente 2:30 no vídeo).
- Os links clicáveis do site exibem todas as páginas, com no máximo quatro páginas e, normalmente, não mais que 250 links internos (-ish) em uma página.
- O texto âncora para links internos é lógico e adiciona relevância hierarquicamente aos dados nas páginas de detalhes.
- Anteriormente, tínhamos definido a taxa de rastreamento mais alta nas ferramentas para webmasters (apenas uma página a cada dois segundos, no máximo). Recentemente, eu voltei para "deixar o Google decidir", e é isso que é recomendado.