Para uma lista mais abrangente de ferramentas de monitoramento e seus recursos, consulte esta página da Wikipedia .
Conforme a pergunta, quais são as ferramentas mais usadas para esta tarefa e quais são seus pontos fortes e fracos?
Para uma lista mais abrangente de ferramentas de monitoramento e seus recursos, consulte esta página da Wikipedia .
Conforme a pergunta, quais são as ferramentas mais usadas para esta tarefa e quais são seus pontos fortes e fracos?
Respostas:
Eu usei Nagios no passado com sucesso. É muito extensível (mais de 200 complementos), relativamente fácil de usar e com muitos relatórios. Um negativo seria a configuração inicial.
O Cacti é um frontend web muito bom para o RRDTool , fornecendo gráficos e estatísticas muito úteis. O RRDTool é a parte que reúne dados de vários sistemas e monitora uma ampla variedade de dados técnicos.
Estamos usando essa solução cacti / RRDTool para monitorar os sistemas Unix e Windows. Temos muitas métricas úteis, incluindo carga, uso de CPU / RAM, espaço em HD, usuários conectados, tráfego de rede, processos em execução e assim por diante.
Você encontrará mais informações sobre cactos na seção O que são cactos? página.
Pessoalmente, eu amo Munin, que é muito fácil de instalar e escrever plugins, pois possui uma arquitetura muito simples. Já existem muitos plugins para todos os fins que você possa imaginar, então você provavelmente nem precisará escrever plugins em primeiro lugar.
Ele também fornece belos gráficos e a opção de configurar alertas (muito básicos).
Zabbix . É de código aberto e razoavelmente simples de configurar e personalizar. Temos muitos scripts de monitoramento personalizados que alimentam o servidor zabbix, mas ele cuida de centralizar esses dados, exibindo-os adequadamente, notificações (email, IM, SMS, twitter, etc.) e assim por diante.
Venho implementando o Spiceworks em nossa empresa e estamos descobrindo que é uma ótima ferramenta, não apenas para monitorar servidores, mas tudo o mais na rede.
Faz coisas como inventário automático e monitoramento personalizado para enviar e-mails quando houver um problema (por exemplo: a impressora reduz 10% da tinta ou o disco rígido deste servidor possui 20%).
Provavelmente, sua desvantagem é a densidade de informações por computador; não se engane, ele tem MUITA quantidade de dados por máquina, mas para coisas como servidores nos quais você pode querer muitas estatísticas, pode precisar usar outra ferramenta.
EDIT: oh, eu mencionei que seu modelo de negócios se baseia em ser livre para sempre.
O sistema de fumaça não apenas verifica a disponibilidade de vários servidores e serviços, mas também mantém o controle de sua latência, fornecendo gráficos fáceis de usar, bonitos e rápidos para exibir .
Uma ampla variedade de plug-ins de medição de latência está disponível imediatamente. Se você conhece algum Perl, é fácil criar seus próprios para quaisquer necessidades exóticas.
Grandes instalações se beneficiarão do sistema Master / Slave para medições distribuídas.
O sistema de alerta altamente configurável ajudará você a detectar problemas antes que eles comecem a afetar os usuários ou evoluam para uma grande interrupção.
O fumo é gratuito e o software OpenSource escrito em Perl por Tobi Oetiker, criador do MRTG e RRDtool
O OpenNMS é usado onde trabalho para monitorar mais de mil máquinas Linux. Monitoramos o hardware de cada máquina e os aplicativos em execução nelas.
O Zenoss Core é de alguma utilidade. Estamos usando (por cerca de um ano) para monitoramento leve de servidores, comutadores de rede e no-breaks.
O Zenoss Core é um premiado produto de monitoramento de TI de código aberto que gerencia efetivamente a configuração, a integridade e o desempenho de redes, servidores e aplicativos por meio de um único pacote de software integrado.
O Nagios é ótimo, pois é gratuito e há muitos plugins para isso. No entanto, a interface do usuário e a configuração são muito difíceis.
É exatamente o oposto nos prós / contras, que também é ótimo: o Microsoft System Center Operations Manager (SCOM), que não é gratuito, tem menos plug-ins, mas a instalação e a configuração são brilhantes e fáceis.
Devo admitir que se eu estivesse em uma empresa principalmente da Microsoft, tivesse requisitos de dependência muito altos (ou seja, não posso pagar pelo monitoramento para interromper) ou tivesse que pensar em conseguir que os desenvolvedores trabalhassem com ele, o SCOM seria minha recomendação sobre o Nagios.
Eu usei:
Usamos o AlertFox há algumas semanas e estamos muito felizes. Ele não apenas verifica nosso tempo de atividade e desempenho, mas também monitora o carrinho de compras, o login do usuário e outras partes críticas do site por meio de scripts de transação (baseados no iMacros).
Para nosso monitoramento interno (espaço em disco, etc), usamos o Nagios .
Como pessoa do Windows, MOM. Esperamos atualizar para o Systems Center Operations Manager (SCOM), mas não precisaremos até começar a implantar o Windows 2008.
Faço parte de um projeto de atualização de monitoramento operacional. Vários fornecedores vieram ao local para apresentar alguns grandes sistemas monetários e misturaram algumas alternativas mais baratas para comparar.
Um deles é o Hyperic , que também está disponível como uma solução de código aberto gratuita. Fiquei impressionado com seus recursos e extensibilidade fornecidos para agentes personalizados.
Para monitorar estatísticas (uso de memória, carga, atividade mysql, atividade apache, etc.), eu uso o Munin . Fora da caixa, ele já acompanha muitas coisas e plota gráficos para diferentes intervalos de tempo (últimas 24 horas, últimos 7 dias, mês passado, ano passado). Através de plugins, ainda mais coisas podem ser monitoradas. Sua saída são páginas HTML com gráficos bonitos.
Munin tem uma arquitetura mestre / nó: os nós reúnem estatísticas em um servidor e o mestre armazena os dados e produz HTML e gráficos.
Uso o Monit para acompanhar os processos em execução e para reiniciar ou alertar-me quando surgem determinadas condições configuráveis (alta carga da CPU, alto uso de memória, nenhuma resposta HTTP etc.) O Monit também pode monitorar coisas mais gerais sobre um servidor, como a CPU carga, uso de memória, status do disco rígido ou uso do disco.
O Monit precisa ser configurado para cada serviço ou hardware que você deseja monitorar e como responder quando algo der errado. As opções mais usadas são não fazer nada, enviar um email de alerta ou reiniciar o serviço.
O Monit é ótimo quando funciona, mas às vezes falha ao iniciar, interromper ou reiniciar um serviço e não há muitas informações de diagnóstico disponíveis para lhe dizer o que deu errado. Isso significa que você não sabe se o problema estava no seu serviço ou na configuração do Monit, que é executada em um ambiente mínimo semelhante ao cron.
Ambas as ferramentas estão disponíveis por padrão na maioria das distribuições Linux.
Estou surpreso que ninguém tenha mencionado logwatch ou logcheck para servidores linux - economiza uma tonelada de tempo lendo logs !!
Eu uso o Pingdom para monitorar meu servidor. Ele me envia uma mensagem SMS quando o servidor está inacessível.
Nosso projeto usa o Ganglia para mais de 100 clusters de nós. Uma razão pela qual a usamos é porque é a ferramenta de monitoramento que acompanha o Rocks .
É importante que tenhamos uma sobrecarga muito baixa em cada nó, para que o maior número possível de recursos esteja disponível para computação. O Ganglia nos fornece uma boa visão geral do cluster e nos permite detalhar os nós individuais, se necessário. Além de saber o que está acontecendo agora, podemos dar uma boa olhada no que aconteceu durante a última hora, dia, semana, mês e ano. Os gráficos de várias estatísticas são básicos e funcionais.
Tudo depende do que você quer dizer com "monitor"!
Um novo participante em cena para competir com o Cacti e as soluções baseadas no RRDTool é o Graphite ( http://graphite.wikidot.com/ )
O RRDTool é substituído por uma loja de suporte chamada Whisper. Os documentos fornecem uma boa visão geral do motivo pelo qual ela difere e eu realmente gosto da CLI para gráficos ad hoc ao investigar algo.
Usamos (e gostamos) do WhatsUp da Ipswitch para nossa rede Windows relativamente pequena. É fácil de configurar, e relativamente fácil de gerenciar, e sabe como lidar com servidores Windows e com outras coisas comuns.
Para redes maiores, redes não orientadas para Windows ou redes com muitas coisas variadas, recomendo vivamente o OpenNMS . O software OpenNMS é gratuito e a empresa está mais do que feliz em vender serviços de suporte e implementação. Também é administrado por um amigo muito afiado meu da faculdade!
Para quem não gosta da interface da web do Nagios, existe o NPC , um plug-in para o Cacti que disponibiliza a interface do Nagios no Cacti, mas com uma aparência melhor (ajax etc.).
Ele lê de um banco de dados fornecido pelo NDO2DB , que é uma ótima maneira de ter sua infraestrutura disponível em um banco de dados para uso em scripts e outras ferramentas.
Atualmente, usamos o PRTG da Paessler . É excelente. Nenhum agente é necessário, excelente interface da web do Ajax, registro histórico, gráficos, WMI, etc. etc. Dinheiro bem gasto.
Hobbit - é uma versão melhor e mais rápida do Big Brother (que parece ser assustadoramente comercial nos dias de hoje).
Se você estiver com pressa e quiser uma ferramenta rápida para monitorar seu servidor MS, use o monitor de desempenho para janelas, configure um log de contador com modelo de monitoramento personalizado e um cronograma de custo (por exemplo: colete dados por 5 minutos a cada hora). Em seguida, baixe o LogParser da Microsoft e a ferramenta Performance Analysis of Logs (PAL) da Codeplex ( http://pal.codeplex.com/ ) para analisar seu log do contador. O PAL gerará um ótimo relatório documentado com links para possíveis documentos / ferramentas para solução de problemas.
Eu uso uma combinação de Solarwinds, guias de desempenho do servidor VMware e scripts personalizados.
O Solarwinds Orion Network Performance Monitor é o que eu uso com nosso sistema Windows. administradores nos meus servidores web. Ainda obtendo algumas métricas úteis de aplicativos em execução, mas há boas informações sobre itens básicos no nível da caixa (disco, rede, CPU).
Para meus convidados do VMware, eu amo as guias de desempenho.
Para meus servidores Sun, quando preciso de algo que não esteja disponível no Solarwinds (porque nosso administrador não o adicionou ou o que), escrevo scripts personalizados (geralmente em Perl) para monitorar coisas como saúde do espelho, uso de trocas etc.
Gostaria de falar mais sobre o Solarwinds, mas há apenas 26 horas por dia (ou seja, meu chefe acredita), então acho que isso pode ser um pouco limitador ...
O Zabbix ( http://www.zabbix.com ) também é bom e mais fácil de configurar do que o Nagios.
Lamento dizer, mas acabei usando muitos scripts personalizados. Embora longe do ideal, duvido que exista uma solução mais comum.
Escrevemos nosso próprio software de monitoramento. Nosso código não é tão sofisticado quanto um pacote comercial, mas não precisamos de muita funcionalidade. Era mais fácil escrever nossos próprios do que investigar outros pacotes e aprender a usá-los. O código faz exatamente o que queremos e é fácil de estender.