É possível pesquisar sites do MediaWiki usando expressões regulares?


9

Gostaria de procurar frases usando expressões regulares em sites como Wikipedia e Wikimedia Commons. É possível fazer isso?

Exemplo de consulta de pesquisa regex: (facebook | google) (histórico corporativo | sites)

Já é possível fazer o mesmo no Google ( como demonstrado aqui ), então quero saber se é possível para a Wikipedia também.


Você gostaria de baixar vários gigabytes de dados e fazer toda a filtragem no seu próprio computador?
svick

Parece que é possível fazer isso usando AutoWikiBrowser: en.wikipedia.org/wiki/Wikipedia:AutoWikiBrowser/...
Anderson Verde

Você pode usar o AWB para pesquisar uma determinada página (ou um conjunto de páginas), mas não todo o wiki, que eu estava assumindo ser o que você queria.
svick

Sim, eu queria pesquisar em todo o wiki. Existem ferramentas no servidor de ferramentas para isso?
Anderson Green

Respostas:


3

É possível pesquisar na Wikipedia (ou em qualquer outro site que um mecanismo de pesquisa possa acessar) usando expressões regulares simples, desde que você dependa de um mecanismo de pesquisa. A seguinte consulta de pesquisa do Google pesquisa na Wikipedia por correspondências da expressão regular (Yahoo|Google|Microsoft):

https://www.google.com/#hl=pt_BR&sclient=psy-ab&q=site:en.wikipedia.org+(google+OR+yahoo+OR+microsoft)&oq=site:en.wikipedia.org+(google+OR + yahoo + OR + microsoft) & gs_l = hp.3 ... 87411.96861.2.97076.26.24.2.0.0.0.79.1141.24.24.0 ... 0.0 ... 1c.1.7.psy-ab.s2oGD_2LKy4 & pbx = 1 & bav = on .2, ou.r_cp.r_qf. & Bvm = bv.44158598, d.dmg & fp = dc8abc04c054405e & biw = 1366 & bih = 639



2

Está disponível e equipado com o CirrusSearch (baseado no ElasticSearch ), que é o mecanismo de pesquisa usado nos sites MediaWiki e na plataforma Wikimedia.

Alguns exemplos de uso:

Nota: Referência completa do guia e fonte - na Wikipedia: Ajuda: Pesquisando # Search_string_syntax .

Quanto à sua pergunta:

Operadores lógicos

O mecanismo de pesquisa suporta lógica booleana nas pesquisas. Os operadores lógicos incluem o caractere "-" (sinal de menos) para "não lógico", AND, OR ou os parênteses de agrupamento: (_).

O OR lógico deve ser escrito em maiúsculas; o operador AND é assumido para todos os termos (separados por espaços), mas o capital AND é equivalente.

Mais exemplos:

  • Simples AND, OR: "credit card" OR "payment card", "credit card" AND "payment card"- funcionará como esperado.
  • Sufixo til caracteres para pesquisa difusa ( "soa como") - Por exemplo, em busca de charlie~ parker~retornos Charlie Parker, Charles Palmer, Charley Parks(até dois diferença de caracteres, não incluindo o primeiro).
  • A pesquisa curinga - pesquisa face*e- começa com facee termina com um ecom qualquer coisa no meio. insira a descrição da imagem aqui

Leitura extra

Leia mais sobre o mecanismo de pesquisa e esta extensão para revelar todas as suas funcionalidades e recursos.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.