Eu tenho algumas VMs no Windows Azure que executam nosso site de comércio eletrônico e, recentemente, começamos a usar Telegraf, InfluxDb e Grafana para ficar de olho nessas máquinas. Após algumas semanas de coleta de dados, notei um padrão estranho relacionado à métrica Memória disponível :
Todos os dias quase sempre no mesmo período do dia, tenho notado que há uma quantidade abrupta de memória sendo liberada que, devido às minhas habilidades muito limitadas de DevOp, não consigo descobrir o que está causando isso.
Aqui está um gráfico que mostra esse padrão:
Minha pergunta é: O que poderia levar a algo assim? Sinto-me tentado a suspeitar que um vazamento de memória é o culpado, mas ... A memória livre nunca cai abaixo de 70% e só acontece em duas das VMs com mais tráfego!
Devo me preocupar quando vejo algo assim?
PS: Comecei a coletar métricas para bytes privados e virtuais para cada um dos serviços do Windows em execução e para o processo w3wp ... embora tenha lido que essas métricas não são muito confiáveis para descobrir se há um vazamento de memória, mas pelo menos tentarei obter algum tipo de tendência e ver se ela se correlaciona com o padrão mostrado acima.