Minha mãe está fazendo um curso on-line para ser uma espécie de bibliotecária; neste curso, eles abrangem pesquisas booleanas, para que possam pesquisar bancos de dados de maneira eficiente; no entanto, ela tem uma pergunta que soa algo como isto:
A pesquisa "x OR y" resultará em 105 000 ocorrências, enquanto uma pesquisa por apenas x resultará em 80 000 ocorrências, e uma pesquisa apenas em y obterá 35 000 ocorrências. Por que a pesquisa "x OR y" fornece 105.000 hits, quando as pesquisas individuais combinadas fornecem 115.000 hits?
Para mim, isso soou estranho, então eu testei isso sozinho, usando as palavras bacon e sanduíche .
- Apenas o bacon produziu 179 000 000 resultados
- Apenas sanduíche produziu 312 000 000 resultados
- bacon OU sanduíche deu 491 000 000 resultados
Mas, para mim, soma: 179 000 000 (bacon) + 312 000 000 (sanduíche) = 491 000 000 (bacon OU sanduíche)
Por que uma consulta OR poderia resultar em menos ocorrências do que as duas consultas individuais combinadas?