Com o movimento NoSQL crescendo com base em bancos de dados baseados em documentos, observei o MongoDB recentemente. Percebi uma semelhança impressionante com como tratar itens como "Documentos", assim como Lucene (e usuários do Solr).
Então, a pergunta: por que você deseja usar o NoSQL (MongoDB, Cassandra, CouchDB, etc) sobre Lucene (ou Solr) como seu "banco de dados"?
O que estou procurando (e tenho certeza que os outros estão procurando) em uma resposta é algumas comparações profundas deles. Vamos pular as discussões de banco de dados relacionais juntas, pois elas servem a um propósito diferente.
O Lucene oferece algumas vantagens sérias, como poderosos sistemas de busca e peso. Sem mencionar as facetas do Solr (que Solr será integrado ao Lucene em breve, sim!). Você pode usar documentos Lucene para armazenar IDs e acessar os documentos como tais, como o MongoDB. Misture-o com o Solr e agora você obtém uma solução com balanceamento de carga baseada em WebService.
Você pode até fazer uma comparação de provedores de cache fora de processo, como Velocity ou MemCached, ao falar sobre armazenamento de dados e escalabilidade semelhantes do MongoDB.
As restrições do MongoDB me lembram o uso do MemCached, mas eu posso usar o Velocity da Microsoft e ter mais poder de coleta de agrupamento e lista do MongoDB (eu acho). Não é possível obter mais rápido ou escalabilidade do que o armazenamento em cache de dados na memória. Até Lucene tem um provedor de memória.
O MongoDB (e outros) têm algumas vantagens, como a facilidade de uso de sua API. Atualize um documento, crie um ID e armazene-o. Feito. Legal e fácil.