Estou tendo uma string HTML e quero descobrir se uma palavra fornecida é relevante nessa string.
A relevância pode ser medida com base na frequência do texto.
Um exemplo para ilustrar meu problema:
this is an awesome bike store
bikes can be purchased online.
the bikes we own rock.
check out our bike store now
Agora eu quero testar algumas outras palavras:
bike repairs
dog poo
bike repairs
deve ser marcado como relevante, ao passo dog poo
que não deve ser marcado como relevante.
Questões:
- Como isso poderia ser feito?
- Como filtrar palavras ambíguas como
in
ouor
Obrigado por suas idéias!
Eu acho que é algo que o Google faz para descobrir quais palavras-chave são relevantes para um site. Basicamente, estou tentando reproduzir seus rankings na página.