Quais são os seus plugins Nagios mais úteis / valorizados? [fechadas]


33

Estamos expandindo nossa configuração do Nagios 3 e frequentemente encontramos novos plugins NRPE ou Nagios gerais para testar nossa infraestrutura existente. No entanto, isso é muito chato - seria útil obter um resumo dos plugins que os usuários do Nagios mais valorizam.

Liste um único plug-in por postagem, de preferência com uma breve descrição do motivo pelo qual você o ama e um link para o MonitoringExchange ou o site do desenvolvedor do plug-in. Dessa forma, as pessoas podem votar em plugins já listados e podemos vê-los em ordem preferencial.

Seria melhor não listar plug-ins que outros já mencionaram, pelo mesmo motivo. Se você tiver mais a adicionar em relação a um plug-in que outra pessoa listou, deixe um comentário na resposta.

Obrigado!

Respostas:


8

Em termos de flexibilidade, você não pode vencer o plug-in snmp. Está por trás de quase todas as verificações que executo e, se não for, a conexão TCP é.


A verificação snmp está ótima para o favorito nesta fase, Matt (e outros :) - você tem alguma técnica especial que utiliza? Minha principal discussão com o net-snmpd no momento é a complexidade da 'nova' funcionalidade de extensão em vez de execução - o check_snmpd lida com isso?
Mike Pountney

7

Nossos plugins mais úteis são aqueles que testam nossa funcionalidade superior do aplicativo. Por exemplo, temos testes que tentam entrar no site e testes que tentam enviar um email e marque uma caixa de correio pop3 para garantir que ele chegou. Se alguma dessas coisas quebrar, podemos usar verificações de nível inferior para ver o que está errado. O pop3 está morto? o MTA, o MDA? O servidor de banco de dados? o armazenamento de dados?


Wotcha Dave;) Você tem alguma dica de como conectar as verificações de nível superior e inferior? Por exemplo, como você cria uma dependência entre enviar um email e marcar a caixa pop3 para ver se está lá? É possível fazer isso puramente via Nagios, ou você está usando sua própria lógica?
Mike Pountney

Você está realmente acordado às 4 da manhã? :) O Nagios possui dependências de serviço, portanto você pode fazer com que sua verificação de email dependa das verificações smtp, MDA e POP3, mas isso significa apenas que a verificação de email não alerta se algum dos de nível inferior o faz. Isso fica muito mais difícil se você tiver um cluster de servidores fornecendo um serviço, pois não há como o nagios dizer "não nos avise sobre esse serviço se todos esses serviços estiverem mortos". Normalmente, confiamos apenas em saber como o sistema se encaixa para saber onde estão os problemas.
David Pashley

7

Honestamente, o que mais faz para mim é bastante antigo check_disk. Nada me faz sentir tão especial, dessa maneira "pare de comer a pasta", pois um servidor que estava funcionando bem ontem explodiu, correndo como um louco e depois descobrindo que é porque deixei os discos encherem. Nunca ter que fazer isso de novo na minha vida vale muito para mim.

(E não esqueça de verificar também os inodes, crianças assistindo em casa.)


7

O WebInject é muito útil para monitorar sites, se você quiser ir além da funcionalidade check_http; ele pode lidar com páginas de login e executar várias etapas em uma verificação do Nagios.


4

Acho que check_nfsmount é útil em muitos dos meus servidores.

Edit: Eu também votaria no check_snmp se eu tivesse o representante para fazer isso. Está em uso em todos os meus servidores, além da lógica por trás do check_hpjd, que eu tenho em execução em todas as minhas impressoras HP.


4

O mais útil é o que eu mesmo escrevi que verifica os certificados SSL em nossos servidores da web para manter um olho na expiração.


É publicado em algum lugar?
5179 RainyRat

4
check_http -H www.verisign.com -C 14
wittwerch

4

PNP (pnp4nagios.org) - gera gráficos no estilo RRD para qualquer verificação do Nagios que produza perf. dados. Incrivelmente útil, especialmente ao tentar convencer os desenvolvedores de que esse serviço recém-instalado é realmente a causa de todos esses picos de CPU ...


3

check_nt (conversando com o NSClient ou algo semelhante sobre o assunto) permite interrogar o WMI em uma caixa do Windows - se houver um contador de desempenho, agora você pode monitorá-lo com o Nagios.


E você pode acompanhar todos os seus serviços que estão sendo executados por exemplo, verificar se a troca ou servidor SQL estão em execução
Simon Foster

2

Esse é um plug sem vergonha, mas se você estiver monitorando máquinas Windows usando NRPE, o NagiosPluginsNT parece funcionar muito bem. ;-)


2

Concordo que o check_snmp é um plugin extremamente valioso; Ele pode ser usado para quase qualquer finalidade e tudo aparece no SNMP em geral. O SNMP está disponível em sistemas tão diversos quanto HP-UX, Tru64 e OpenVMS sem instalações adicionais.

Outro (não muito) plugin que é muito útil é o NagiosGrapher; Tenho minha experiência em um artigo que explica mais, mas também para que outros possam usá-lo sem nenhuma dificuldade que eu tenha experimentado.

Um último: NSCA. Você pode escrever um script Perl, Ruby ou ksh e alimentar a saída no NSCA.

Entre as flexibiidades do NSCA e do SNMP combinadas com os relatórios do NagiosGrapher, isso deve expandir seu monitoramento muito bem.


2

Eu gosto de check_http para verificar se meus sites ainda estão funcionando, eu o expandi para verificar se algum texto pode ser encontrado após uma vez em que minha empresa de hospedagem decidiu servir páginas em branco e minhas verificações do nagios passaram todas enquanto o servidor ainda estava em execução.


2

O mais útil para mim é aquele que escrevi para minhas necessidades: nagios-check-webpage

Ele baixa uma página inteira com js / css / images, com multi-threads e gzip (economiza muita largura de banda), como navegadores reais.


+1 De fato, esse plugin é incrível. Usá-lo para o aplicativo. 4 meses agora.
Henk

1

O número um é o NagiosWSC. Ele permite que você faça o monitoramento sem agente de hosts Windows através de WMI


sem agente, mas com um grande ponto único de falha, ugh.
Toto

1

Uma que verifica a latência real para acessar sites e a procura por uma tag oculta 'status: ok'. Foi detectado um problema com o cache do squid e um problema no conjunto de idiomas que acontecia apenas uma vez a cada três noites às 3 da manhã, quando alguém acessava o site com um navegador que solicitava uma versão internacionalizada da página em idioma turco.

Sério, configure todo tipo de monitoramento possível. Os bugs e erros estranhos que você pode capturar em um ambiente complexo com um bom monitoramento são simplesmente incríveis. Além disso, registre seus dados de desempenho em um banco de dados rrd e exiba-os no Cacti.


1

Um dos plugins mais importantes é o que eu escrevi para mim: check_rdiff_backup. Faço backups no exterior e o Nagios me diz se e quando algo acontece com eles.

Se você está procurando pelo plug-in rdiff-backup, há um que você pode encontrar no Google.


1
Você conhece um para o rsnapshot?
Rory

1

check_curl para mim foi uma dádiva de Deus. Realmente fez a diferença na flexibilidade ao fazer verificações no site e também achei muito mais fácil do que o webinject, com quase todas as mesmas funcionalidades que eu precisava


1

Não é estritamente um plugin, mas fazer com que o twurl ( https://github.com/marcel/twurl ) funcione como um meio de acionar alertas foi uma dádiva absoluta. Não há necessidade de alertas por SMS e apenas satisfatório.

Detalhes sobre como isso foi feito: os alertas do Nagios usando o twitter (com twurl) não disparam - desculpas pela autopromoção desavergonhada;)

Outras coisas...

O Check_diskio ( https://trac.id.ethz.ch/projects/nagios_plugins/wiki/check_diskio ) foi incrivelmente útil em conjunto com as verificações padrão de carga da CPU e número do processo para determinar quando / se o IO está vinculado e de que maneira . O uso do nagiosgraph ( http://exchange.nagios.org/directory/Addons/Graphing-and-Trending/nagiosgraph/details ) torna ainda mais fácil.





0

Isso é meio que trapaça, porque eu desenvolvi bastante e realmente verifica muitas coisas diferentes ao mesmo tempo, mas o 'plugin' mais útil dos nagios para mim é o Resmon . É um agente que você executa no próprio servidor e o nagios se conecta através de http para executar as verificações. Eu acho que é semelhante ao que o nrpe faz, mas com várias decisões de design diferentes.


0

Eu tinha usado dois plugins .. um era para fornecer feed XML dos alertas e outro para enviar alertas via twitter. Ambos foram úteis (além dos plugins regulares). se você contar o NRPE como um plug-in, adicione-o também.


0

check_apt é muito legal e me lembra sobre atualizar meus servidores Debian.


0

Recentemente, comecei a usar o plug- in check_multi , usando um NRPE corrigido / aprimorado para saída grande (por causa das informações de desempenho e HTML).
É quase "um plugin para governar todos eles"! ;-)

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.