Onde trabalho, temos vários servidores "big iron", usados para hospedar muitas máquinas virtuais usando um Xen Hypervisor. Geralmente, eles são configurados com 32 GB de RAM, processos de núcleo quádruplo e discos rápidos com capacidade de E / S.
Estamos no momento em que a configuração de hardware existente está ficando um pouco mais demorada e é hora de sair e adquirir um hardware novo maior, mais rápido e mais brilhante.
Como mencionado acima, o kit existente foi implantado com 32 GB de RAM e isso limitou efetivamente o número de VMs que podemos implantar em um host.
Porém, ao investigar o hardware mais novo, é evidente que você pode obter mais e mais RAM em uma única máquina com 64, 72 ou mesmo 96 GB em um único chassi. Evidentemente, isso nos permitirá obter mais máquinas para um determinado host, o que é sempre uma vitória. A análise concluída até o momento sugere que o fator limitante será agora transferido para o subsistema de disco.
O problema agora é tentar ter uma idéia de onde estamos ... Em virtude do uso, sabemos que não estamos limitados em termos de largura de banda de E / S, mais ainda, o número de I aleatórios. Operações operacionais que podem ser concluídas. Sabemos que, uma vez atingido esse ponto, o iowait vai disparar foguetes e todo o desempenho da máquina vai para os cães.
Agora, esse é o cerne da pergunta que estou fazendo. Alguém conhece uma maneira de rastrear / tendências com precisão o desempenho de E / S existente, especificamente com relação ao número de operações de E / S aleatórias concluídas?
Na verdade, estou tentando obter uma métrica "essa configuração pode lidar com êxito com um número X de solicitações aleatórias de E / S, e atualmente estamos (em média) realizando operações Y com um pico de operações Z".
Desde já, obrigado!