O que é melhor para os mecanismos de pesquisa?
Não importa. O que importa é: o que é melhor para os usuários?
Um mecanismo de pesquisa moderno não deve confiar em regras estranhas sobre o que é um separador de palavras e o que é um marceneiro de palavras ou o que seja. Os mecanismos de pesquisa modernos podem lidar com erros de digitação, apóstrofos, pontuação, etc. Descobrir quais caracteres separam as palavras não deve ser um problema.
Discordo das pessoas que afirmam que os hífens são melhores porque são delimitadores naturais de palavras. Eles meio que são, mas meio que não são: eles fazem palavras semi-anexadas ou semi-delimitadas. O delimitador de palavras naturais é% 20.
Mas as declarações acima são irrelevantes. O URL não deve ser importante de qualquer maneira.
Qual a importância das palavras-chave no URL?
Eles não devem ser importantes, se forem, obviamente não há conteúdo na página.
Os URLs não são muito visíveis para humanos: os links podem ter um texto âncora, mas não é mostrado na página nem nas guias do navegador.
O <title /> e o cabeçalho principal são mais visíveis e geralmente contêm as mesmas palavras-chave, tornando as palavras-chave no URL redundantes.
Quão importante é para os seres humanos?
Depende.
Do ponto de vista do mecanismo de pesquisa: de maneira alguma, o usuário precisa apenas inserir uma consulta de pesquisa e clicar no trecho com um título e uma descrição interessantes.
Mas os visitantes também vêm de outros lugares. Em alguns casos, há um bom texto âncora, tornando a "qualidade da URL" irrelevante, mas há casos em que isso importa.
Cópia / compartilhamento rápidos e sujos de URL: não há problema para o gravador, mas é importante para o leitor.
Precisando inserir o URL manualmente. (Não é possível copiar texto de uma imagem, por exemplo.)
O que determina a qualidade de um URL?
Comprimento; Você não deseja que as barras de endereço rolem horizontalmente ou apenas os links de URL para quebra de linha. E escusado será dizer: também leva mais tempo para digitar um URL mais longo.
Delimitadores de palavras; Parece que a maioria das pessoas concorda que os hífens são melhores.
Desordem; Por exemplo: IDs exclusivos, extensões de nome de arquivo, parâmetros de URL estranhos. Estes são difíceis de lembrar.
Caracteres e sintaxe estranhos; Um exemplo desatualizado seria o tildes ( http://example.com/~user/ ), mas a sintaxe do parâmetro da URL também é um pouco estranha. Qualquer personagem incomum pode ser difícil de digitar para algumas pessoas.
Caracteres seguros vs Unicode; Esta é uma espada de dois gumes e merece sua própria resposta. Mas, brevemente: os navegadores alteram URLs,% c3% a4 etc. é difícil de digitar, nem todo teclado pode digitar caracteres inseguros, possivelmente algum tipo de codificação, mas as palavras-chave fazem sentido para os falantes nativos.
Comprimento do texto; Considere o URL como uma forma de título, não perca palavras mencionando o óbvio e ignore a gramática.
As pessoas digitarão algo ligeiramente diferente
Seu servidor da web deve ser projetado para redirecionar URLs não canônicos reconhecidos para sua versão canônica. Cabe a você decidir:
Mas seu servidor precisa aceitar e corrigir todos eles.
Uma página 404 com resultados de pesquisa seria agradável para o usuário. (Use as palavras do URL como consulta de pesquisa.)
+
(mais).