Os sistemas de gerenciamento de banco de dados implementam seus próprios diários através dos logs do banco de dados, portanto, a instalação desse DBMS em um sistema de arquivos com diário prejudica o desempenho por meio de dois mecanismos:
O diário redundante aumenta a quantidade de atividade do disco
O layout do disco físico pode ser fragmentado (embora alguns sistemas de arquivos diários tenham mecanismos para limpar isso).
Muita atividade do disco pode preencher o diário, causando condições espúrias de 'disco cheio'.
Eu já vi uma instância há alguns anos em que isso foi feito no sistema de arquivos LFS em uma instalação Baan em uma caixa HP / UX. O sistema apresentava problemas persistentes de desempenho e corrupção de dados, que não foram diagnosticados até que alguém descobrisse que os sistemas de arquivos foram formatados com LFS.
Volumes contendo arquivos de banco de dados normalmente terão um pequeno número de arquivos grandes. Os servidores DBMS normalmente têm uma configuração que configura quantos blocos são lidos em uma única E / S. Números menores seriam apropriados para sistemas de processamento de transações de alto volume, pois minimizariam o armazenamento em cache de dados redundantes. Números maiores seriam apropriados para sistemas como data warehouses que faziam muitas leituras sequenciais. Se possível, ajuste o tamanho do bloco de alocação do sistema de arquivos para ter o mesmo tamanho da leitura de vários blocos em que o DBMS está definido.
Alguns sistemas de gerenciamento de banco de dados podem trabalhar com partições de disco bruto. Isso fornece graus variados de ganho de desempenho, geralmente menos em um sistema moderno com muita memória. Em sistemas mais antigos com menos espaço para armazenar em cache os metadados do sistema de arquivos, a economia na E / S do disco era bastante significativa. Partições brutas tornam o sistema mais difícil de gerenciar, mas fornecem o melhor desempenho disponível.
Os volumes RAID-5 incorrem em mais sobrecarga de gravação que os volumes RAID-10; portanto, um banco de dados ocupado com muito tráfego de gravação terá um desempenho melhor (geralmente muito melhor) em um RAID-10. Os logs devem ser colocados fisicamente volumes de disco separados para os dados. Se o seu banco de dados for grande e principalmente somente leitura (por exemplo, um data warehouse), pode haver um caso de colocá-lo nos volumes RAID-5, se isso não atrasar indevidamente o processo de carregamento.
O cache de write-back em um controlador pode oferecer uma melhora no desempenho às custas da criação de alguns modos de falha (razoavelmente improváveis, mas possíveis) em que os dados podem ser corrompidos. O maior ganho de desempenho para isso é em cargas de acesso altamente aleatórias. Se você quiser fazer isso, considere colocar os logs em um controlador separado e desativar o cache de write-back nos volumes de log. Os logs terão melhor integridade dos dados e uma única falha não poderá remover os volumes de log e de dados. Isso permite restaurar a partir de um backup e avançar dos logs.