Descubra quando uma frase foi adicionada a uma página da Wikipedia


9

Existe alguma maneira de descobrir quando uma palavra ou frase específica foi adicionada a uma página da Wikipedia? Quero encontrar uma maneira de obter a primeira página que contém uma correspondência de uma frase específica (por exemplo, a primeira ocorrência <ref>webapps.stackexchange.com</ref>no histórico de revisões de uma página). (Pesquisar manualmente o histórico de revisões de uma página seria extremamente tedioso, por isso vou precisar de algum tipo de solução automatizada.)


Esta questão é relevante (mas parece estar a discutir um assunto um pouco diferente, e requer algum conhecimento de sistemas de controle de revisão): webapps.stackexchange.com/questions/15938/...
Anderson Verde

Para ajudar as pessoas a encontrarem isso no google: quando uma palavra foi adicionada a uma página da Wikipedia?
fNek

@fNek Veja a resposta abaixo: você pode usar o WikiBlame para descobrir quando uma palavra ou frase foi adicionada a uma página.
Anderson Green

Respostas:


7

Existe uma ferramenta chamada WikiBlame que permite fazer exatamente isso: você insere um nome de página e uma frase para pesquisar e direciona você para a edição que a adicionou.

Ele também está vinculado na página Histórico de todas as páginas da Wikipedia em inglês (como "Pesquisa no histórico de revisões").


Na página de resultados da pesquisa, a primeira ocorrência da frase de pesquisa é encontrada ao lado de "Inserção encontrada entre". Você pode pesquisar em todo o histórico de revisões digitando um número grande no campo "Revisões para verificar" (por exemplo, 10000.) Para pesquisar exclusivamente por wikitext, selecione "forçar a pesquisa por wikitext".
Anderson Green

Aqui está um exemplo específico de uma pesquisa (para a frase "jogabilidade principal" no artigo "Minecraft"): wikipedia.ramselehof.de/…
Anderson Green

1

A Wikimedia fornece um despejo XML do histórico completo de revisões de todos os artigos da Wikipedia. Este conjunto de dados contém uma versão desses dados a partir de abril de 2010. Este conjunto de dados não contém o texto completo das revisões, mas apenas as metad informações sobre as revisões, incluindo itens como idioma, registro de data e hora, artigo e similares.

Em todas as páginas, no canto superior direito, há um Historybotão que leva você ao histórico de revisões dessa página.

insira a descrição da imagem aqui

Fonte: História de Revisão da Wikipedia


Como você pode obter um despejo XML do histórico de revisões para uma página específica?
Anderson Green

Veja a edição. É isso que você estava procurando?
abhshkdz

Eu preferiria algum tipo de solução automatizada, em vez de percorrer todas as revisões manualmente para encontrar uma sequência específica. É possível encontrar a primeira ocorrência de uma frase no histórico de revisões (sem pesquisar manualmente, o que pode levar horas)?
Anderson Green

11
Usar o dump XML é um exagero: você realmente não precisa fazer o download do histórico completo de revisões de todos os artigos da Wikipedia apenas para pesquisar o histórico de um artigo.
svick

Obviamente. Eu estava apenas dando todas as informações disponíveis.
abhshkdz
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.