No momento (2017), o projeto de código aberto mais ativo que implementa isso parece ser Anystyle Parser (última versão 07-2016). Pode ser usado através de uma interface da web, API ou baixado como um RubyGem.
Eles mencionam explicitamente em seu site que a implementação é inspirada no ParsCit (última versão 2013?) E FreeCite (última confirmação 2009).
Forme também o site deles:
O AnyStyle Parser usa poderosas heurísticas de aprendizado de máquina baseadas em Campos Aleatórios Condicionais, que podem ser treinados por todos que usam nosso editor interno.
Esse é um recurso muito interessante, que torna essa a implementação mais interessante (imho). O treinamento parece ser bastante direto, conforme explicado na documentação da API . Você apenas fornece alguns resultados corrigidos manualmente e executa o Anystyle.parser.train
comando. Não sei se o ParsCit e o FreeCite também suportam isso, mas, se não, isso me parece uma grande diferença de recursos.