Li recentemente quatro livros neste campo:
Feldman, R. e James Sanger, J. (2006). Manual de mineração de texto: abordagens avançadas na análise de dados não estruturados. Cambridge University Press.
Este enfoca exemplos práticos, software e mineração de texto aplicada. Ele fornece vários exemplos de uso prático da mineração de texto. Pode ser interessante se você quiser ler sobre aplicativos comerciais de ferramentas de mineração de texto.
Srivastava, AN e Sahami, M. (2009). Mineração de texto: classificação, cluster e aplicativos. Chapman & Hall / CRC.
É uma série de trabalhos de pesquisa que são usados como exemplos de uso de diferentes ferramentas de mineração de texto. É bastante focado como no teste introdutório.
Weiss, SM, Indurkhya, N., Zhang, T. e Damerau, F. (2005). Mineração de Texto: Métodos Preditivos para Analisar Informações Não Estruturadas.
Springer.
Texto muito introdutório que descreve algumas questões gerais.
Manning, C. (1999). Fundamentos do processamento estatístico de linguagem natural. MIT Pressione.
Este é o melhor livro que eu já li sobre esse assunto. Está bem escrito, claro, vai mais fundo na teoria, mas de maneira prática. Começa com uma introdução geral, mas analisa alguns dos métodos e algoritmos mais usados. Se você tivesse que escolher apenas um livro, eu recomendaria este.
Você também pode encontrar facilmente vários livros sobre processamento de linguagem natural e mineração de texto que se concentram no uso de R ( biblioteca tm ) ou Python ( biblioteca nltk ).