Como você mencionou o cluster, usamos o conjunto HPCC . É preciso um pouco de esforço para configurar e ajustar, mas, no nosso caso, o ponto não estava se gabando por si só, fazia parte dos critérios de aceitação do cluster; alguns benchmarking de desempenho são essenciais para garantir que o hardware funcione conforme anunciado, tudo esteja corretamente conectado etc.
Agora, se você quer apenas um número FLOPS de pico teórico, esse é fácil. Basta verificar um artigo sobre a CPU (digamos, no realworldtech.com ou algo assim) para obter informações sobre quantos DP FLOPS um núcleo de CPU pode fazer por ciclo de clock (com as atuais CPUs x86 que geralmente são 4). Então o pico total de FLOPS é apenas
número de núcleos * FLOPS / ciclo * frequência
Então, para um cluster com rede IB, você poderá atingir cerca de 80% do pico de FLOPS no HPL (que BTW é um dos parâmetros de referência no HPCC).