Existe algum utilitário como grep
ou mesmo uniq
para pesquisa inexata, ou eu mesmo deveria escrever?
Quero dizer, ele parecerá 90% (o número pode variar) correspondente, ou algo assim. Por exemplo, eu tenho um arquivo com várias strings:
abc123
abd123
abc223
qwe938
Nesse caso, esse utilitário deve retornar as três primeiras cadeias ou dizer que são semelhantes. Claro que não conheço nenhum padrão de conteúdo de arquivo, como no caso de grep
ou uniq
.
Isso é muito específico do conjunto de dados. Por exemplo, Mary é como Marie ou ABC é como BCD? Você pode dar um exemplo real dos seus dados?
—
EightBitTony