Existem muitas soluções de monitoramento por aí. Todo mundo tem sua preferência e cada empresa tem suas próprias necessidades, portanto não há uma resposta correta. No entanto, eu posso ajudá-lo a descobrir o que você pode procurar na escolha de uma solução de monitoramento.
Para que servem os sistemas de monitoramento?
Em geral, os sistemas de monitoramento servem a dois propósitos principais. O primeiro é coletar e armazenar dados ao longo do tempo. Por exemplo, você pode querer coletar a utilização da CPU e fazer um gráfico com o tempo. O segundo objetivo é alertar quando as coisas não estão respondendo ou não estão dentro de certos limites. Por exemplo, você pode querer alertas se um determinado servidor não puder ser alcançado por pings ou se a utilização da CPU estiver acima de uma certa porcentagem. Existem também sistemas de monitoramento de log como o Splunk, mas estou tratando aqueles como separados por isso.
Essas duas funções principais às vezes vêm em um único produto, outras vezes e mais comum é ter um produto dedicado a cada finalidade.
Quais são os principais componentes e recursos dos sistemas de monitoramento?
Pesquisadores :
Todos os sistemas de monitoramento precisam de algum tipo de pesquisador para coletar os dados. Nem todos os dados são coletados da mesma maneira. Você deve examinar o seu ambiente e decidir quais dados você precisa e como eles podem ser coletados. Em seguida, verifique se o sistema de monitoramento que você escolhe suporta o que você precisa. Alguns métodos comuns incluem:
- SNMP (Protocolo Simples de Gerenciamento de Rede)
- WMI (Instrumentação de Gerenciamento do Windows)
- Executando scripts (por exemplo, executando um script na máquina que está sendo monitorada ou executando um script a partir da própria caixa de monitoramento que usa seu próprio método de pesquisa). Isso pode incluir coisas como scripts Bash, scripts Perl, executável e scripts do PowerShell
- Monitoramento Baseado em Agente. Com isso, um processo é executado em cada cliente e coleta esses dados. Esses dados são enviados por push ao servidor de monitoramento ou o servidor de monitoramento controla o agente. Alguns administradores concordam com os agentes, outros não gostam deles, pois podem deixar uma área maior no servidor que está sendo monitorado.
- APIs focadas (ou seja, API VMWare ou a capacidade de executar consultas SQL)
Se você possui principalmente um sistema operacional em seu ambiente ou um sistema operacional primário, determinados sistemas podem ter mais opções que outros.
Configuração :
nos sistemas de monitoramento, costuma haver muita reutilização de objetos. Por exemplo, você deseja monitorar um determinado aplicativo, como Apache ou IIS, em vários servidores. Ou você deseja que certos limites sejam aplicados a grupos de servidores. Você também pode ter certos grupos de pessoas para "estar de plantão". Portanto, um bom sistema de modelos é vital para um sistema de monitor.
A configuração geralmente é feita através de uma interface do usuário ou arquivos de texto. A opção da interface do usuário geralmente será mais fácil, mas os arquivos de texto tendem a ser melhores para reutilização e variáveis. Portanto, dependendo da sua equipe de TI, você pode preferir a simplicidade do que o poder.
Interface do usuário :
A interface mais comum para monitorar sistemas atualmente é uma interface da web. Algumas coisas a avaliar em relação à interface da web são:
- Boas visões gerais
- Boas páginas de detalhes
- Velocidade (quando você precisa encontrar informações no modo de crise, uma interface lenta pode ser muito frustrante
- Sentimento geral. Você gastará muito tempo na interface. Se parecer desajeitado, sua equipe de TI se sentirá resistente a usá-la.
- Costumização. Toda organização tem certas coisas que são importantes e outras que não são. É importante poder personalizá-lo de acordo com suas necessidades
Mecanismo de alerta :
O mecanismo de alerta deve ser flexível e confiável. Existem muitas maneiras diferentes de ser notificado, incluindo:
- SMS
- O email
- telefone
- Outras coisas como IM / Jabber
Outros recursos a serem procurados são:
- Escalonamentos (notifique alguém se a outra pessoa não reconheceu ou corrigiu o alerta)
- Rotações e turnos
- Grupos (determinados grupos precisam ser notificados de certas coisas)
É importante confiar que, quando algo der errado, você receberá o alerta. Isso se resume a duas coisas:
- Um sistema confiável
- Uma configuração livre de ressalvas. Nos sistemas de monitoramento, não é incomum pensar que você deve receber um alerta, mas devido a alguns detalhes na configuração, o alerta nunca foi acionado.
Armazenamento de dados :
se o sistema coleta e armazena dados (isto é, sistemas que incluem gráficos), o sistema armazena dados. Uma implementação muito comum para a loja e gráficos é RRD, por exemplo.
Alguns recursos para procurar no armazenamento de dados são:
- Acesso bruto aos dados. Isso pode ser valioso para desenvolver ou criar gráficos personalizados com algo como o Excel.
- Escalabilidade. Dependendo da quantidade de dados coletados, você pode adicionar rapidamente, se você deseja coletar muito, deseja garantir que eles sejam redimensionados.
Biblioteca de
gráficos : Os gráficos podem ser úteis para identificar rapidamente tendências e contextualizar o estado atual de algo com base em seu histórico. Algumas incluem tendências que podem ser úteis para prever coisas antes que elas aconteçam (por exemplo, ficar sem espaço em disco). Verifique se os gráficos fornecerão as informações que você acha que precisará de maneira clara.
Controles de acesso :
se você tem uma organização grande, pode precisar de controles de acesso, porque determinados administradores só podem ajustar determinadas coisas. Você também pode querer painéis voltados para o público. Se isso for importante, verifique se o sistema de monitoramento possui os controles necessários.
Outras características
Relatórios :
um sistema que fornece bons relatórios pode ajudar a identificar o que precisa ser aprimorado por longos períodos de tempo. Por exemplo, pode dar uma boa resposta para coisas como "quais sistemas mais desistem?". Isso pode ser importante quando você está tentando convencer a gerência a gastar dinheiro em certas coisas - os negócios são uma prova concreta.
Recursos especializados :
Alguns sistemas de monitoramento são direcionados a produtos específicos ou têm mais suporte do que outros. Por exemplo, se a principal coisa que você precisa monitorar é o SQL Server, ou se você faz uso intenso dos produtos VMWare, deve ver como eles são suportados.
Modelos de monitoramento predefinidos :
um sistema que vem com muitos modelos predefinidos (ou possui uma base de usuários que criou muitos modelos) pode economizar muito tempo.
Descoberta :
se você tiver um ambiente grande ou em mudança. Alguns sistemas oferecem a capacidade de adicionar novos sistemas por meio de uma API ou executar varreduras para encontrar novos servidores ou componentes.
Monitoramento distribuído:
se você tiver vários locais para monitorar, pode ser útil monitorar os pollers em cada local, em vez de muitos sistemas independentes estarem monitorando via WAN.
Alguns sistemas de monitoramento populares
Existem muitos sistemas de monitoramento por aí. Temos uma lista com um resumo sobre essa pergunta antiga . Para uma referência rápida, alguns dos quais eu mais ouço são:
- Nagios
- Cactos
- OpenNMS
- Ventos solares
- Zabbix
- Vários sistemas de monitoramento baseados em nuvem
- Microsoft System Center
- Este ainda não é popular, mas o Stack Exchange abriu seu sistema de monitoramento http://bosun.org
Como decidir com base no acima
O motivo pelo qual não posso lhe dizer o que usar é porque toda organização tem suas próprias necessidades. Se você quiser fazer a escolha certa, pense em todos os componentes acima e descubra quais recursos são importantes para sua organização. Em seguida, encontre um sistema ou sistemas que pretendam fornecer o que você precisa e experimente-os. Alguns deles custam um pouco, muito ou são gratuitos. Levando tudo isso em conta, você poderá fazer sua escolha. Pelo que usei, todos estão longe de serem perfeitos, mas pelo menos você pode tentar obter algo que se encaixe.