Com o Hadoop e o CouchDB em todo o Blogs e notícias relacionadas, o que é um armazenamento (mecanismo) tolerante a falhas distribuído que realmente funciona.
- O CouchDB, na verdade, não possui nenhum recurso de distribuição embutido, pelo que sei, a cola para distribuir entradas automaticamente ou mesmo bancos de dados inteiros está simplesmente ausente.
- O Hadoop parece ser amplamente utilizado - pelo menos, é bom para a imprensa, mas ainda tem um único ponto de falha: o NameNode. Além disso, ele só pode ser montado via FUSE, eu entendo que o HDFS não é realmente o principal objetivo do Hadoop
- O GlusterFS tem um conceito de nada compartilhado, mas ultimamente eu li vários posts que me levaram à opinião de que não é tão estável
- O Lustre também possui um único ponto de falha, pois usa um servidor de metadados dedicado
- O Ceph parece ser o player preferido, mas a página inicial afirma que ainda está nos estágios alfa.
Portanto, a questão é qual sistema de arquivos distribuído possui o seguinte conjunto de recursos (sem ordem específica):
- Compatível com POSIX
- fácil adição / remoção de nós
- conceito de nada compartilhado
- roda em hardware barato (processadores AMD Geode ou VIA Eden)
- autenticação / autorização incorporada
- um sistema de arquivos de rede (eu gostaria de montá-lo simultaneamente em diferentes hosts)
Bom ter:
- arquivos acessíveis localmente: posso desmontar um nó, montar a partição com um sistema de arquivos local padrão (ext3 / xfs / qualquer que seja ...) e ainda acessar os arquivos
Estou não à procura de aplicações hospedadas, em vez de algo que vai me permitir tomar dizer 10GB de cada uma das nossas caixas de hardware e ter essa armazenamento disponível em nossa rede, Facilmente montável em uma multidão dos exércitos.