Existe alguma API para rastrear resumo de papel?


13

Se eu tiver uma lista muito longa de nomes de artigos, como obter um resumo desses artigos na Internet ou em qualquer banco de dados?

Os nomes dos artigos são como "Avaliação da utilidade na mineração da Web para o domínio da saúde pública".

Alguém conhece alguma API que possa me dar uma solução? Eu tentei rastrear o Google Scholar, no entanto, o Google bloqueou meu rastreador.


2
Duvido que exista alguma API geral para isso. Você pode tentar rastrear vários serviços, como o Academia.edu, sites de editores e assim por diante. No entanto, seria mais fácil criar um banco de dados local de documentos primeiro e depois experimentar a extração dos resumos.
Wojciech Walczak

Obrigado pela sua resposta! Eu já construí um banco de dados local para isso. O problema de rastrear a partir de vários serviços é que preciso criar regras de análise para cada site.
Alex Gao

Então, que tal converter PDFs em TXTs e depois extrair os resumos com expressões regulares?
Wojciech Walczak

valeu! No entanto, o contrato afirma que o download massivo de documentos não é permitido. Isso cria alguma dor de cabeça.
Alex Gao

2
Acho que esse link de resposta de estouro de pilha fornece a melhor resposta que posso obter. Talvez as pessoas que encontrarem esse problema também possam dar uma olhada nesta página.
Alex Gao

Respostas:


8

Procure em:

Se você obtiver uma única correspondência exata do título, provavelmente encontrará o artigo certo e poderá preencher as demais informações a partir daí. Ambos oferecem links para download e saída no estilo bibtex. O que você provavelmente gostaria de fazer para obter metadados perfeitos é fazer o download e analisar o pdf (se houver) e procurar o identificador no estilo DOI.

Seja gentil e limite os seus pedidos se fizer isso.


5

O arXiv possui uma API e um download em massa, mas se você quiser alguma coisa para periódicos pagos, será difícil encontrá-lo sem pagar um indexador como pubmed ou elsevier ou algo semelhante.


1
Muito obrigado. No entanto, o arXiv fornece os documentos de que preciso.
Alex Gao
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.