Há algum tempo, venho tentando descobrir por que alguns de nossos sistemas críticos para os negócios estão recebendo relatórios de "lentidão" que variam de leve a extrema. Recentemente, voltei meus olhos para o ambiente VMware, onde todos os servidores em questão estão hospedados.
Recentemente, baixei e instalei a avaliação do pacote de gerenciamento Veeam VMware para o SCOM 2012, mas estou tendo dificuldade em acreditar (e meu chefe também) nos números que estão me reportando. Para tentar convencer meu chefe de que os números que estão dizendo são verdadeiros, comecei a procurar no próprio cliente VMware para verificar os resultados.
Eu olhei para este artigo do VMware KB ; especificamente para a definição de Co-Stop, que é definida como:
Tempo em que uma máquina virtual MP estava pronta para ser executada, mas ocorreu um atraso devido à contenção de agendamento da co-vCPU
Para o qual estou traduzindo
O sistema operacional convidado precisa de tempo do host, mas precisa aguardar a disponibilidade de recursos e, portanto, pode ser considerado "sem resposta"
Esta tradução parece correta?
Nesse caso, aqui é onde tenho dificuldade em acreditar no que estou vendo: O host que contém a maioria das VMs "lentas" está atualmente mostrando uma média de Co-stop de CPU de 127.835,94 milissegundos!
Isso significa que, em média, as VMs neste host precisam aguardar mais de 2 minutos pelo tempo de CPU ???
Este host possui duas CPUs de quatro núcleos e possui convidado de CPU 1x8 e convidados de CPU 14x4.