Usamos o Nagios para monitorar alguns servidores (~ 130). Monitoramos CPU, disco, RAM e algumas outras coisas em cada servidor. Eu sempre usei o SSH para executar os comandos remotos, simplesmente porque requer pouca ou nenhuma configuração adicional no servidor remoto, basta instalar o nagios-plugins, criar o usuário do nagios e adicionar a chave SSH, tudo que eu automatizei no um script de shell. Na verdade, nunca considerei as implicações de desempenho do uso do SSH sobre o NRPE.
Não estou muito preocupado com a carga atingida no servidor Nagios (provavelmente está superespecificado para o que faz, nunca ultrapassou 10% da CPU), mas executamos cada verificação remota a cada 30 segundos e cada servidor tem 5 verificações diferentes realizada. Presumo que o SSH exija mais recursos para cada verificação, mas há uma enorme diferença? (Ou seja, há diferença suficiente para justificar a mudança para NRPE).
Se for de alguma ajuda, monitoramos uma mistura de servidores físicos (normalmente com 8, 12 ou 16 núcleos físicos) e instâncias médias / grandes do Amazon EC2.