Como pesquisar em PDFs usando expressões regulares?


15

Normalmente, uso o Notepad ++ para pesquisar arquivos usando expressões regulares. Hoje, estou me perguntando se existe um programa em PDF que faça o mesmo para PDFs. Claro que eu poderia converter o PDF em texto e usar o Notepad ++, mas existe uma maneira mais fácil sem converter?


1
Qual sistema operacional você está usando?
21412 Scott McClenning

Visualização do desenvolvedor do Windows e Windows 7
Michael S.

Respostas:



4
  1. O Agent Ransack é gratuito (gratuito) e suporta PDF, conforme confirmam suas notas de versão.
  2. PowerGREP é um produto comercial.

Assim como você disse, a alternativa evidente é converter PDFs em texto. Uma maneira de um programador configurar isso para o processamento em massa é usar o pacote PDFMiner do Python. O Agent Ransack usa "pdftotext" do projeto Xpdf (e você também pode).


sidenote: Agente Ransack é a versão lite do FileLocator
akira

Obrigado! Eu olhei mais de perto. As notas de versão do fornecedor confirmam que o File Locator Lite, também conhecido como Agent Ransack, suporta PDF. Editando minha resposta.
Minopret

O agente Ransack faz o trabalho. Você também pode tentar o DnGrep.
Michael S.
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.