Pesquisando arquivos txt, pdf e doc


9

Preciso de algo que possa pesquisar rapidamente muitos arquivos .txt, .pdf e .doc (também preferível .djvu). Alguém aqui pode nomear ou recomendar essa ferramenta (plataforma Windows)?


Apenas para esclarecer: você precisa de algo que possa pesquisar apenas esses tipos de arquivos?
Isxek

2
@ Isxek - bem, eu preciso desses arquivos. A capacidade de pesquisar por outros também não será prejudicial.
Rook

Respostas:


3

PowerGREP é outra sugestão.

No site deles:

PowerGREP é uma poderosa ferramenta grep do Windows. Pesquise rapidamente um grande número de arquivos no seu PC ou rede, incluindo arquivos binários e de texto, arquivos compactados, documentos do MS Word, planilhas do Excel, arquivos PDF, arquivos do OpenOffice, etc. Encontre as informações desejadas com poderosos padrões de texto (expressões regulares) especificando a forma do que você deseja, em vez de texto literal.

Não é gratuito (custa 149 dólares), mas parece ser o mais adequado para o que você está procurando (exceto o DJVU - ainda não encontrei nada que possa pesquisá-los).


Bem, pouco antes de ver essa resposta, me deparei com ela, e realmente parece ser capaz de pesquisar em PDFs sem a tagarelice.
Rook

4

saque do agente. (apenas pesquise no Google)

também tem a vantagem de pesquisar muito rapidamente em unidades de rede.


Quando eu o uso para procurar uma palavra em um diretório cheio de PDFs, isso me deixa sem sentido na janela de visualização. Deveria funcionar assim?
Rook

não o usei em pdf recentemente, então pode muito bem fazer. versão comercial tem suporte adicional (pode fazer melhor em pdf)
Tim Williscroft

Certifique-se de que você tenha a opção 'formato PDF' marcada na guia Opções
snowdude




2

Eu usei o Copernic Desktop Search por um tempo. Ele ainda consegue pesquisar em anexos de email.


Também recomendo o Copernic ... O uso por alguns meses e é o melhor que já encontrei. Usou o Google Desktop e o Blinkx, mas o Copernic é gratuito e realmente útil. Indexa todo o conteúdo de pdf, doc, docx, cs, vb (programação também!) + Muito mais. A melhor característica é ele mostra quando você pesquisa, o local exato onde o texto que você procurar é ...
Ranhiru Jude Cooray

1

Eu uso o Agent Ransack no trabalho. Ele funciona muito bem e tenta pesquisar também em arquivos binários. Ele encontrará texto nos FLAs e pode usar expressões regulares.


1

Eu uso o AstroGrep:

O AstroGrep é um utilitário grep do Microsoft Windows. O Grep é um programa de linha de comando UNIX que pesquisa nos arquivos por palavras-chave. O AstroGrep suporta expressões regulares, opções versáteis de impressão, armazena os caminhos usados ​​mais recentemente e possui um recurso de "contexto", que é muito bom para examinar o código-fonte.

.. e o melhor: é grátis.

http://astrogrep.sourceforge.net


Não é ruim, mas ainda tem problemas para passar por arquivos pdf. Gibberish e não encontrar todas as correspondências.
Rook

não procurar dentro pdf (Eu apenas tentei)
JinSnow

1

Eu sugiro que você procure no File Content Finder (aviso de isenção de responsabilidade - sou desenvolvedor). Ele foi projetado especificamente para pesquisar o conteúdo do arquivo sem indexação. Ele suporta todos os principais formatos de arquivo - pdf, doc (x), xls (x), pptx, rtf e outros.

Sua filtragem permite otimizar e refinar sua pesquisa por vários critérios - tipo de arquivo, datas de criação / modificação, etc.

Você pode obtê-lo na Mac App Store ou na Microsoft Store .

O Agent Ransack é um aplicativo semelhante, mas funciona apenas no Windows e suporta menos formatos de arquivo (não suporta arquivos de documentos!).



0

Eu tenho sua resposta !!! Você precisa instalar o cygwin para windows. Isso permitirá que você use os comandos * Unix em um ambiente Windows e é totalmente gratuito. Depois de instalá-lo, você pode usar a função 'grep' regular para pesquisar o que quiser.

Aqui está o link para download: http://www.cygwin.com/setup.exe


afaik, grep não faz arquivos pdf e doc.
Rook


0

Eu uso o Windows Power Shell. Ele funciona ao procurar por seqüências de caracteres em txt e doc. Não tenho certeza sobre arquivos pdf.

O comando que eu uso é o seguinte:

Get-ChildItem -Recurse | Select-String "find this string"
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.