10
Substituir um contador de loop de 32 bits por 64 bits introduz desvios de desempenho malucos com _mm_popcnt_u64 em CPUs Intel
Eu estava procurando o caminho mais rápido para popcountgrandes matrizes de dados. Eu encontrei um efeito muito estranho : alterar a variável de loop de unsignedpara uint64_treduzir o desempenho em 50% no meu PC. O benchmark #include <iostream> #include <chrono> #include <x86intrin.h> int main(int argc, char* argv[]) { using namespace …