Estou estudando esse assunto há vários dias e encontrei muitas sugestões conflitantes com relação à indexação de pesquisa. Estou trabalhando em um projeto que possui várias páginas diferentes, desde descrições simples de produtos até documentação detalhada do usuário.
Dividi esta questão em seções, pois sinto que isso a tornará mais útil para futuros leitores dessa questão.
Algumas das minhas descobertas
Vários sites parecem ter assumido contornos de documentos como os seguintes:
1. Programmer's Guide (https://www.dartlang.org/docs/)
1. Getting Started
2. Concepts
1. Libraries
2. Fundamental classes
etc.
Acho interessante que o exemplo acima não utilize o <nav>
elemento com um cabeçalho adequado. Gosto da simplicidade do esboço e, sendo o Google, tenho certeza de que eles sabem o que estão fazendo quando se trata disso.
Mas estou confuso, já que o esquema acima não menciona "Dart". A única menção de "Dart" no sentido semântico parece estar dentro do <title>
elemento principal do documento "Guia do programador | Dart: aplicativos da web estruturados".
O MDN (Mozilla Developer Network) é outro exemplo brilhante de um site que segue esse princípio. Muitos dos <h1>
títulos fornecem contexto completo ( seções e esboços de um documento HTML5 ):
1. Sections and Outlines of an HTML5 Document
1. Untitled Section (nav)
2. Untitled Section (nav)
3. Structure of a Document in HTML 4
4. Problems Solved by HTML5
Enquanto outros não fazem muito sentido fora do contexto ( práticas obsoletas a serem evitadas ). Por exemplo, o seguinte esboço HTML5 se refere a CSS, HTML5 ou C # ... apenas com o esboço do documento, quem sabe!
1. Obsolete practices to avoid
1. Untitled Section (nav)
2. Untitled Section (nav)
3. Doctype
4. <meta> element and charset attribute
Para piorar a situação, o que aconteceria se o MDN contivesse 2 tópicos com o mesmo título (ou muito semelhante) do título "Práticas obsoletas a serem evitadas", onde um faz parte do guia CSS e o outro faz parte do guia HTML ...
No outro extremo do espectro, os sites parecem usar o <body>
cabeçalho de nível principal para o nome do produto (Foo) ou o contêiner de tópicos (Guia do Usuário para Foo). Onde todas as páginas subsequentes são usadas <h2>
para o título da página real.
A questão
Como os mecanismos de pesquisa inferem o contexto de uma página da Web como as encontradas no site da MDN usando o DOM e o esquema HTML5?
Qual é a maneira correta de marcar a página HTML5 a seguir para que o Google possa indexar a página no contexto adequado? Isto inclui o uso de <title>
, <header>
e <h1>
elementos.
- Nome da empresa
- Nome do Produto
- Guia de usuario
- Começando
O cabeçalho mais significativo do HTML, exibido em um navegador da Web, deve representar o contexto de todo o site (Nome da Empresa ou Nome do Produto), a coleção de tópicos (Guia do Usuário) ou o tópico real em questão (Introdução) ?
Meu melhor palpite
<!DOCTYPE html>
<html>
<head>
<title>Getting Started | User Guide | Product Name - Company Name</title>
</head>
<body>
<header role="banner"> <!-- Note: Lack of <h1> in here -->
<a id="logo" href="http://example.com">Company Name</a>
<nav>
<h1>Site Navigation</h1>
<ul> ... </ul>
</nav>
</header>
<main role="main">
<div class="product-name">Product Name</div>
<div class="document">User Guide</div>
<h1>Getting Started</h1>
<p>blah</p>
</main>
</body>
</html>
Levando ao esboço:
1. Getting Started
<title>
para fornecer contexto. Por exemplo, é uma má idéia incluir o mesmo <h1>User Guide for Ubermachine</h1>
em todas as páginas em que o cabeçalho do tópico é apresentado <h2>Getting Started</h2>
... ou o esboço deve começar <h1>Getting Started</h1>
com um acompanhamento <title>Getting Started | User Guide for Ubermachine</title>
para fornecer um contexto útil para os mecanismos de pesquisa. Esta é uma pergunta de SEO.
<title>
fornece contexto suficiente.