Você pode escrever um software para:
- Pegue as palavras-chave da expressão regular;
- Pesquise no Google as palavras-chave e obtenha uma lista de resultados;
- Rastreie cada URI resultante e filtre-o com expressão regular completa.
Vamos estudar um caso: site:gog.com
encontre todos os jogos com dublagem em espanhol.
A expressão regular é:
Audio[^:]*:[^.,]*Spanish
Deve corresponder, por exemplo:
Audio lanuage: English, German, Spanish, French.
E não corresponde:
Audio language: only-English. Text language: Spanish.
Etapa 1. Deixe seu software pesquisar isso no Google:
site:gog.com audio Spanish inurl:game
inurl:game
aqui significa apenas pesquisar nas páginas de descrição do jogo
Etapa 2. Obtenha os 300 links resultantes e entre em cada um deles.
Etapa 3. Filtre o resultado com a expressão regular fornecida:
Audio[^:]*:[^.,]*Spanish
Isso deve ser fácil de construir. Na verdade, não entendo por que não consegui encontrar algo que já foi construído dessa maneira.
Como os mecanismos de pesquisa não podem dispor do recurso para digitalizar seus dados com expressão regular, esse trabalho sujo é da sua parte, e seu computador deve fazer isso com o que os mecanismos de pesquisa já fornecem.