No Word, remova espaços espúrios após as cotações iniciais

O FineReader OCR, com saída para o Word, muitas vezes coloca um espaço espúrio após a inicial "no discurso relatado e que eu desejo remover. Usando Localizar e Substituir: Localizar" * ", no entanto, não distingue o espaço após o inicial" e após o final, também escolherá a string entre a final "de uma citação e a inicial" da próxima citação.

Soluções alternativas são VBA (que eu teria que aprender) ou um programa Perl (que requer uma revisão considerável), mas eu preferiria não seguir essas rotas, já que na minha idade, o esforço intelectual que elas exigiriam poderia não ser sustentável.

microsoft-word

— Lawrie Hodges
fonte

Com pontuação normal, uma solução simples é procurar [ " ] e substitua por [ "] (Eu estou usando colchetes para legibilidade: eles são não parte da pesquisa ou substituição de strings, aqui ou abaixo), mas isso não funcionará quando as cotações estiverem no início das linhas ou quando houver espaços em branco no texto entre aspas.

Eu encontrei uma solução mais geral, mas isso não pode ser feito em uma única substituição:

Primeiro, encontre pares de citações correspondentes com ["*"].
Em seguida, marque-os com um caractere que não seja usado no documento; Eu tenho usado # para ilustração, mas você pode usar qualquer outro caractere ou até mesmo uma seqüência de caracteres.
Definir o texto de substituição como [#^&#] e substituir todos ( ^& substitui a string de correspondência original).
Agora você pode remover os espaços iniciais substituindo [#" ] com ["].
Por fim, remova o restante # caracteres substituindo [# ] com [].

Isso vai dar errado se houver alguma cotação sem correspondência.

Eu não tenho uma versão atualizada do Office, mas certamente funciona em versões mais antigas, e não estou ciente de grandes alterações para localizar / substituir em versões posteriores.

— AFH
fonte

Eu acredito que você pode precisar substituir [#"] com ["] depois do step4 para lidar com as strings entre aspas que não tenham adicionado espaço (ou pelo menos seria prudente fazê-lo).

— G-Man

@ G-Man - Bom ponto: vou atualizar minha resposta. Eu deletei originalmente tudo # na etapa final, mas decidiu que era mais seguro incluir as citações caso o personagem fosse usado em outro lugar. Voltarei ao que testei. Muito obrigado.

— AFH

Obrigado a ambos. Parece uma boa solução. Sim, eu percebi que citações inigualáveis causariam problemas. Eu só espero que eu pegue aqueles na edição inicial dentro do FineReader antes de exportar para o Word. Aliás eu estou usando o W7 e o Office 2007

— Lawrie Hodges

@LawrieHodges - Você pode percorrer rapidamente o documento usando a próxima linha de pesquisa inicial "*", para verificar se você está correspondendo aos pares de cotações que você espera.

— AFH

@AFH - Isso anula o objeto. Enquanto eu estou avançando, eu também posso excluir quaisquer espaços espúrios que eu vá. Isso é o que vem fazendo até agora. Mas, com um longo documento, tornou-se tedioso.

— Lawrie Hodges