Usamos grafite para rastrear o histórico de utilização do disco ao longo do tempo. Nosso sistema de alerta examina os dados da grafite para nos alertar quando o espaço livre cai abaixo de um determinado número de blocos.
Gostaria de receber alertas mais inteligentes - o que realmente me interessa é "quanto tempo tenho antes de fazer algo sobre o espaço livre?", Por exemplo, se a tendência mostrar que em 7 dias ficarei sem disco espaço, em seguida, levante um aviso; se for menos de 2 dias, levante um erro.
A interface de painel padrão do Graphite pode ser bastante inteligente com derivativos e faixas de confiança de Holt Winters, mas até agora não encontrei uma maneira de converter isso em métricas acionáveis. Também estou bem em analisar os números de outras maneiras (basta extrair os números brutos da grafite e executar um script para fazer isso).
Uma complicação é que o gráfico não é tranquilo - os arquivos são adicionados e removidos, mas a tendência geral ao longo do tempo é que o uso do espaço em disco aumente; portanto, talvez seja necessário examinar as mínimas locais (se observar a métrica "sem disco") ) e desenhe uma tendência entre as cavidades.
Alguém já fez isso?
The volume of crap people have to store will expand to fill the disk available.
- Old Sysadmin Axiom