Ao instalar o munin, ele ativa um conjunto padrão de plugins (pelo menos no ubuntu). Como alternativa, você pode simplesmente executar munin-node-configure
para descobrir quais plugins são suportados no seu sistema. A maioria desses plugins plotam dados diretos. Minha pergunta não é explicar a natureza dos dados (bem ... talvez para alguns), mas o que você procura nesses gráficos?
É fácil instalar munin e ver gráficos sofisticados. Mas ter os gráficos e não ser capaz de "lê-los" os torna totalmente inúteis.
Vou listar plugins padrão que são ativados por padrão no meu sistema. Então vai ser uma lista longa. Para ser completo, também vou listar os plugins que penso entender e dar uma breve explicação sobre o que acho que é usado. Fundamentos corretos se eu estiver errado com algum deles.
Então, deixe-me dividir essas perguntas em três partes:
- Plugins em que eu nem entendo os dados
- Plug-ins onde eu entendo os dados, mas não sei o que devo procurar
- Plugins que penso entender
Plugins em que eu nem entendo os dados
Estes podem conter perguntas que não são necessariamente destinadas apenas a munin. Não entender os dados geralmente significa uma lacuna no conhecimento fundamental sobre sistemas operacionais / hardware ....;) Fique à vontade para responder com uma resposta "giyf".
Estes são plugins em que eu só posso adivinhar o que está acontecendo ... Eu quase não quero ver esses "adivinhações" ...
- E /
S de disco por dispositivo (E / s) / segundo O que é um E / S. Eu sei que significa entrada / saída. Mas isso é o mais longe possível. - Latência do disco por dispositivo (espera média de E / S)
Não faz ideia do que é uma "espera E / S" ... - Tempo de serviço de IO
Esta é uma bagunça enorme e é quase impossível ver alguma coisa no gráfico.
Plug-ins onde eu entendo os dados, mas não sei o que devo procurar
- IOStat (blocos / segunda leitura / escrita)
Suponho que o que devemos procurar aqui são picos? O que significaria que o dispositivo está em uso pesado? - Entropia disponível (bytes)
Suponho que isso seja importante para a geração de números aleatórios? Por que eu representaria isso? Até agora, o valor sempre foi quase constante. - VMStat (processos de suspensão / E / S em execução)
Qual é a diferença entre este e o gráfico "processos"? Ambos mostram os processos de execução / suspensão, enquanto o gráfico "Processos" parece ter mais detalhes. - Taxa de transferência de disco por dispositivo (bytes / segundo de leitura /
gravação ) Qual é a diferença entre este e o gráfico "IOStat"? - uso da tabela de inodes
O que devo procurar neste gráfico?
Plugins que penso entender
Vou adivinhar algumas coisas aqui ... me corrija se eu estiver errado.
- Uso do disco em porcentagem (porcentagem)
Quanto espaço em disco é usado / restante. Como isso se aproxima de 100%, considere limpar ou estender a partição. Isso é extremamente importante para a partição raiz. - Taxa de transferência do firewall (pacotes / segundo)
O número de pacotes que passam pelo firewall. Se isso ocorrer por um longo período, pode ser um sinal de um ataque do DOS (ou estamos simplesmente recebendo um arquivo grande). Também pode lhe dar uma idéia sobre o desempenho do seu firewall. Se estiver nivelando e você precisar de mais "energia", considere o balanceamento de carga. Se estiver nivelando e houver uma correlação com a carga da CPU, isso também pode significar que seu hardware não é rápido o suficiente. Correlações com o uso do disco podem apontar para destinos de LOG excessivos na sua configuração do FW. - erros eth0 (entrada / saída de pacotes)
Erros de rede. Se esse valor estiver aumentando, pode ser um sinal de hardware defeituoso. - Tráfego eth0 (bits / segundo in / out)
Tráfego de rede não processado. Isso deve estar relacionado à taxa de transferência do Firewall. - número de threads
Um valor cada vez maior pode apontar para um processo que não fecha adequadamente os threads. Investigar! - processos
Divisão de processos ativos (incluindo suspensão). Um rápido aumento aqui pode apontar para uma bomba de garfo. Um valor lento, mas sempre crescente, pode apontar para um processo que gera subprocessos, mas não para fechá-los adequadamente. Investigue usandops faux
. - prioridade do processo
Mostra a distribuição das prioridades do processo. Ter apenas processos de alta prioridade não é muito útil. Considere a priorização de alguns. - uso da CPU
bastante simples. Se isso estiver aumentando, você pode ter um ataque em andamento ou um processo está monopolizando a CPU. Se estiver aumentando lentamente e se aproximando do máximo em operações normais, considere atualizar seu hardware (ou balanceamento de carga). - uso da tabela de arquivos
Número de arquivos abertos ativamente. Se isso estiver atingindo o máximo, você poderá abrir um processo, mas não liberar arquivos corretamente. - load average
Mostra um valor resumido para a carga do sistema. Deve estar correlacionado com o uso da CPU. Valores crescentes podem vir de várias fontes. Procure correlações com outros gráficos. - uso da memória
Uma representação gráfica da sua memória. Contanto que você tenha muitos buffers + cache + não utilizados, você estará bem. - troca in / out
Mostra a atividade na sua partição de troca. Sempre deve ser 0. Se você observar alguma atividade, adicione mais memória à sua máquina!