Uma média de carga menor que o número de CPUs que você tem significa que há outras que ficam sentadas sem nada para fazer. Igual significa que todos estão trabalhando no momento. Maior significa que existem processos que podem estar em execução, mas estão presos na fila de espera.
Para coisas super sensíveis ao tempo, como um servidor voip ou memcache, você deseja que seu load avg esteja bem abaixo do número de núcleos. Para coisas assíncronas que podem viver com o backup ocasional (como e-mail), você pode executar facilmente 4x o número de núcleos.
A maior ressalva a ser lembrada é que os processos que aguardam E / S de disco ou de rede, mas que são executáveis, ainda aparecem na média de carga. Portanto, se você tiver um servidor apache alimentando jpg de 56k usuários, poderá executar uma média de carga muito mais alta do que se tiver que disparar respostas php / script para um proxy / loadbalancer em uma LAN de gigabit. No seu caso, uma conexão smtp com algum servidor de correio lento que leva uma eternidade para transferir um anexo mostrará um processo 1 na fila de execução, mas pode ser interrompida vinte vezes para enviar um email rápido de uma linha para o gmail sem problemas.
O impulso é empurrado, a carga média é como a DOW. Na verdade, ele não mede de maneira alguma a "economia", as pessoas simplesmente a usam como uma métrica muito pouco correlacionada, porque é fácil falar sobre isso. Concentre-se no monitoramento das métricas com as quais você realmente se importa, como a profundidade da fila de entrega e as mensagens por segundo.