Existe uma maneira de pesquisar no Google usando expressões regulares (regex)?


60

Seria muito útil se o Google fornecesse uma pesquisa por expressão regular .

Existe uma maneira de fazer isso?

(OBS: Eu não estou falando sobre expressões falsas regulares, como site:, filetype:, AND, ORou "Text". Eu gostaria de pesquisar com uma expressão regular como .+[]^).

Por exemplo, existe um aplicativo, um site ou uma ferramenta do Google para pesquisar coisas como *.stackexchange?

Respostas:


24

Esse recurso não está disponível na Pesquisa clássica do Google e não está no roteiro do Google. Você pode aprender mais sobre este tópico assistindo ao vídeo do Google O Google implementará a capacidade de pesquisar com expressões regulares?

No entanto, há uma exceção. A Pesquisa de código do Google suporta expressões regulares. Obviamente, o destino da pesquisa para este mecanismo de pesquisa de tópicos é reduzido apenas ao código-fonte.

Vale ressaltar que algumas palavras-chave de pesquisa do Google podem substituir parcialmente expressões regulares. Por exemplo, se você quiser pesquisar qualquer variação de duas palavras de "TERM de pesquisa", poderá usar o operador curinga.

search *

encontrará resultados para pesquisa e qualquer outra (uma) palavra. Costumo usá-lo para verificar regras ou sinônimos básicos da gramática inglesa (por exemplo, "tão fácil quanto *" ).


2
Google Code Search não existe mais , mas pode haver alternativas (não que ele é relevante para esta pergunta)
musefan

Agora, esta resposta está um pouco desatualizada: veja esta resposta, por exemplo, nas pesquisas de expressões regulares do Google.
Anderson Green

11

A Pesquisa do Google pode retornar as correspondências de algumas expressões regulares simples. Por exemplo, a consulta de pesquisa

"(gray|red) (wolf|fox)"

parece ser equivalente a

("gray wolf" OR "red fox" OR "red wolf" OR "gray fox")

Você pode ver a saída desta consulta de pesquisa aqui .


Estou procurando um medicamento ou nome químico. Eu posso ler "heme? Llnate" - onde os pontos de interrogação são ilegíveis. O Google não pode ajudar.
SDsolar

7

O SymbolHound possui uma pesquisa de repositório de código- fonte aberto , semelhante à opção de pesquisa de código do Google, agora descontinuada, além de uma pesquisa na Web com símbolos que indexa sites relacionados à programação, como o Stackoverflow.


11
Se você é afiliado à SymbolHound, você pode indicar isso em seu perfil. Obrigado!
Codingbadger

5

Você pode escrever um software para:

  1. Pegue as palavras-chave da expressão regular;
  2. Pesquise no Google as palavras-chave e obtenha uma lista de resultados;
  3. Rastreie cada URI resultante e filtre-o com expressão regular completa.

Vamos estudar um caso: site:gog.comencontre todos os jogos com dublagem em espanhol.

A expressão regular é:

Audio[^:]*:[^.,]*Spanish

Deve corresponder, por exemplo:

Audio lanuage: English, German, Spanish, French.

E não corresponde:

Audio language: only-English. Text language: Spanish.

Etapa 1. Deixe seu software pesquisar isso no Google:

site:gog.com audio Spanish inurl:game

inurl:game aqui significa apenas pesquisar nas páginas de descrição do jogo

Etapa 2. Obtenha os 300 links resultantes e entre em cada um deles.

Etapa 3. Filtre o resultado com a expressão regular fornecida:

Audio[^:]*:[^.,]*Spanish

Isso deve ser fácil de construir. Na verdade, não entendo por que não consegui encontrar algo que já foi construído dessa maneira.

Como os mecanismos de pesquisa não podem dispor do recurso para digitalizar seus dados com expressão regular, esse trabalho sujo é da sua parte, e seu computador deve fazer isso com o que os mecanismos de pesquisa já fornecem.


+1. Muito obrigado. Esta é uma ideia muito interessante, de fato. O principal problema é que provavelmente precisaremos de clusters de alto desempenho para fazer algo realmente interessante.
GarouDan

Estou escrevendo esta extensão agora.
Navin

4

Não, infelizmente não :(. Em teoria, você poderia criar seu próprio mecanismo de pesquisa e fazê-lo, mas isso seria bem difícil.


1

Apenas para referência, a ajuda do Google nos operadores de pesquisa está aqui .

Curiosamente, "-" ainda é um operador para exclusão de palavras, mas eles removeram "+" como operador, usado no passado para exigir um determinado termo de pesquisa. Aparentemente, "O operador + foi aposentado quando o Google+ foi iniciado, porque + era necessário como um personagem pesquisável em vez de um operador." ( Https://support.google.com/websearch/answer/2466433 )


0

Você pode começar com uma pesquisa detalhada do Google para selecionar o texto de destino a ser pesquisado. Em seguida, abra, digamos, os 50 principais resultados em várias guias e use o complemento "Fastest Search" do mingyi para pesquisar os resultados usando uma expressão regular.



-3

Se você conhece o VBA, pode escrever um código para obter dados da Web para o Excel. Eu corro o programa dia e noite e posso obter milhões de resultados. Depois disso, você pode filtrar a partir desses resultados.


2
oh, deus ... perdoar os pecados
beppe9000
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.