Estou monitorando a pilha TCP em um servidor na esperança de inferir genericamente problemas com o aplicativo na caixa.
Minha primeira inclinação é medir o número de soquetes em todos os estados relatados (LISTEN, ESTABLISHED, FIN_WAIT2, TIME_WAIT, etc) e detectar algumas anomalias.
Um colega de equipe sugere que 'lsof' seria uma ferramenta melhor para ver em que estado as pilhas do TCP estão.
Alguma preferência ou dicas de experiência da multidão de falhas no servidor?