Estou trabalhando em um cálculo de "parte traseira do envelope" para uma configuração de banco de dados de relatórios de 100 TB. Estou procurando pensamentos dos especialistas aqui. Ambiente proposto:
- Capacidade de armazenamento ~ 100 TB
- Tabelas ~ 200, tamanhos que variam de 1 GB a 5 TB. tamanho médio pode estar entre 100GB-200GB
- ETL - os trabalhos podem exigir junção entre tabelas de dezenas de milhões de linhas, com chaves de junção que variam de 10 a 500 bytes. essas junções devem terminar em menos de 2-5 minutos
- Seleção ao vivo - inicialmente, apenas interessado em velocidades selecionadas. deve suportar 500 seleções / segundo. As atualizações / segundo serão um número relativamente menor e podem ser ignoradas para este exercício.
- precisa de disponibilidade 24x7. 2 servidores de banco de dados independentes devem estar disponíveis para atender chamadas selecionadas (com dados replicados).
Questões:
- No momento, estou olhando para o Oracle. Como tem sido sua experiência com outras soluções comerciais (ou) de código aberto para grandes bancos de dados?
- Qual sistema operacional de hardware você viu funcionar melhor? Estou planejando o Linux na Dell.
- O armazenamento em rede, como o NetApp, é obrigatório? Que problemas você prevê com o uso de discos comerciais prontos para uso?
- Quando o hardware e o sistema operacional estiverem prontos, quanto tempo você reservaria para instalar, configurar o banco de dados, o armazenamento etc.
- Quais composições de equipe funcionaram melhor nos ambientes que você observou? Quero dizer, os vários administradores (administrador de SO, Oracle DB Admin?) Necessários para gerenciar e operar essa configuração. Quantos deles podem ser necessários para obter um tempo de atividade 24x7.
- Qualquer aproximação / intervalo em licenças de banco de dados, custos de armazenamento em rede.
Eu sei que não tenho todos os detalhes do ambiente. Não estou procurando detalhes exatos, basta uma aproximação. Embora algumas das perguntas possam ser melhor respondidas pelos gerentes, estou interessado na perspectiva dos administradores. Agradeço sua opinião.