Eu tenho uma imagem de uma página de um livro e quero dividi-la em pequenas palavras separadas. Existe uma maneira de fazer isso?
Você está falando sobre OCR, como você marcou isso, ou cortando a imagem em imagens de palavras individuais?
—
fixer1234
Cortando a imagem em imagens de palavras individuais. Não sabia o que marcar.
—
webmagnets
Supondo que as linhas estejam igualmente espaçadas, você poderia automatizar a divisão de cada linha, provavelmente usando um software de imagem comum que faz operações em lote (estou pensando no Irfanview, mas você não indica seu sistema operacional). Separar cada palavra é mais complicado. Você pode fazer algo como copiar a página para uma camada e usar um filtro para desfocar muito as palavras até o ponto em que elas são bolhas escuras. Em seguida, selecione com base em um intervalo de cores que inclui os blobs de palavras, mas não os intervalos mais leves entre eles. Aplique a seleção à camada original. Não tenho certeza como você salvaria cada um em um arquivo separado, no entanto.
—
fixer1234