Como encontrar todos os domínios que contêm sequência específica


11

Eu quero saber quais são as diferentes pedia.

Quero uma lista de todos os domínios registrados, que terminam com pedia.org, pedia.comou pedia.info, (por exemplo, WIKIpedia.orgou Anotherpedia.info).

Respostas:


5

Se você deseja conseguir isso usando um mecanismo de pesquisa existente, pode usar os Operadores de mecanismo de pesquisa do Google , que podem ser muito poderosos:


Essa consulta de pesquisa fornecerá uma lista de todos os domínios registrados que terminam com pedia.org, pedia.comou pedia.info(não é tão poderoso quanto a segunda consulta de pesquisa, porque é limitada - mas é isso que você solicitou):

"pedia.org" OR "pedia.com" OR "pedia.info"

Operadores de pesquisa usados:

  • Citações: procure uma palavra ou frase exata: "search query"

  • Operador OR: pesquise por uma das palavras: query OR query


EDITAR:

Dave Rook tem sugerido que essa consulta de pesquisa: site:*pedia.*.

O problema com esta consulta é que, por alguma razão, ele só lista domínios que precedem -ou .antes pedia, como Unor fora pontudo. Parece um bug e, por isso wikipedia.org, não aparecerá nos resultados da pesquisa.

No entanto , existe outro operador de pesquisa (menos popular) que é realmente muito útil:

  • in: Pesquise no URL / título da página / corpo da página / backlinks:

    inurl:query intitle:query intext:query inanchor:query

Então, se você quiser uma busca mais ampla (em vez de limitar-se a .org, .com, .infolocais Pedia), dois muito poderosas consultas de pesquisa seria:

inurl:*"pedia"* intitle:*"pedia"*
inurl:*pedia* intitle:*pedia*

allin poderia ser mais poderoso, mas não é possível combiná-lo com outro operador de pesquisa e, portanto, é melhor usar em seu lugar.

Como ele procura pediano URL e no título, ele fornece apenas sites reais de pedia.


Obrigado. Eu estava procurando por algum script de shell que imprima uma lista de domínios, mas a abordagem do mecanismo de pesquisa é utilizável, só precisa de mais trabalho para cavar no resultado da pesquisa. Aceitando. ;)
kobame 19/09/12

@kobame Adicionei uma poderosa consulta de pesquisa adicional, que você pode achar útil. Veja minha resposta (editada).
Amiregelz 29/09/2012

5

Você precisa usar o curinga, que é um astrix em *torno de uma string de consulta e a palavra-chave 'site:' para informar ao Google que está buscando uma pesquisa no site. Digite o seguinte no Google: (sem espaços e exatamente como está)

site:*pedia.*

ou clique neste link do Google.com.br (que é um atalho para mostrar ao Google o termo de pesquisa acima).

No entanto, como você verá, isso não servirá apenas para os sites de estilo da Wikipedia e não o limitará apenas a .com, .org e .info.

Você também precisará observar que fazer uma pesquisa no Google.com.br possivelmente fornecerá resultados diferentes em comparação com Google.com, Google.fr, Google.de etc.

Cada * representa apenas uma ou mais palavras. O Google trata o * como um espaço reservado para uma palavra ou mais de uma palavra. Por exemplo, ["Google * minha vida"] diz ao Google para encontrar páginas que contenham uma frase que comece com "Google" seguida de uma ou mais palavras, seguida de "minha vida". As frases que se encaixam no projeto incluem: "O Google mudou minha vida", "O Google administra minha vida" e "Google é minha vida".

Operador de wildchild do Google


Obrigado também (+1), mas aceitou a solução amiregelz porque seus resultados são mais consistentes. Com a sua abordagem, obtive mais de um resultado para cada domínio encontrado, por exemplo, www.energy-pedia.com ou soo.
kobame

Com esta consulta, não recebo o wikipedia.org. Parece que apenas lista domínios que precedem " -" ou " ." antes " pedia".
unor

@unor Atualizei minha resposta com uma consulta de pesquisa aprimorada, obrigado por apontar isso.
amiregelz
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.