Quais são os pacotes de mineração de texto para R e existem outros programas de mineração de texto de código aberto?


12

Você pode recomendar um pacote de mineração de texto no R que possa ser usado em grandes volumes de dados?
Em segundo lugar, existe uma GUI disponível para qualquer um dos pacotes de mineração de texto no R?
Em terceiro lugar, existe outro programa de mineração de texto de código aberto fácil e intuitivo de usar?


@mbq: bem, "existe um pacote de mineração de texto de código aberto com uma GUI?" provavelmente cobriria todas as três perguntas muito bem, meio que já é uma pergunta ...
naught101

Respostas:




4

Aqui estão mais dois projetos integrados:

  • Python Natural Language Toolkit (instalação fácil, boa documentação)
  • Java MALLET (sem experiência, mas parece promissor; incluído no link fornecido por @Nick)

Ambos são softwares de código aberto.



1

GATE é muito abrangente. Também permite trabalhar com diferentes idiomas e possui um editor de ontologia.


0

Andrew McCallum (UMass) tem alguns projetos de software relacionados à PNL disponíveis em sua página da web . Estes estão todos em Java (eu acho) com código fonte disponível.


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.