4
Como alcanço o máximo teórico de 4 FLOPs por ciclo?
Como o desempenho teórico máximo de 4 operações de ponto flutuante (precisão dupla) por ciclo pode ser alcançado em uma moderna CPU Intel x86-64? Até onde eu entendo, são necessários três ciclos para um SSE add e cinco ciclos para que um mulseja concluído na maioria das CPUs modernas da …