NOTA: Esta resposta foi escrita há 8 anos. A programação paralela tornou-se mais relevante. Provavelmente, isso se deve aos limites inerentes de velocidade do relógio e aos limites de tamanho do transistor que se aproximam rapidamente.
Seu principal problema é o software não escrito para multi-core.
Veja o excelente artigo de Jeff Atwood sobre Escolhendo Dual Core ou Quad Core .
para a maioria dos softwares, você atinge um ponto de retorno decrescente muito rapidamente após dois núcleos. Em desktops quad-core e retornos decrescentes , questionei a eficácia com que o software de hoje pode realmente usar até quatro núcleos de CPU, muito menos os inevitáveis oito e dezesseis núcleos de CPU que veremos daqui a alguns anos.
Você foi respondido aqui (destaque copiado do artigo de Jeff),
No entanto, houve algumas surpresas aqui, como o Excel 2007 e a configuração "operações simultâneas" do Lost Planet. É possível que a engenharia de software avance até o ponto em que a velocidade do relógio importe menos que o paralelismo. Ou, eventualmente, pode ser irrelevante, se não conseguirmos escolher entre velocidades de clock mais rápidas e mais núcleos de CPU. Enquanto isso, a velocidade do relógio ganha na maioria das vezes. Mais núcleos de CPU não são automaticamente melhores . Os usuários típicos terão melhor desempenho com a CPU dual-core mais rápida possível.
A questão do Front-Side Bus (esse termo sempre me divertiu).
Com Nehalem, as coisas mudam ... como a ArsTechnica disse no ano passado.
A Lei de Moore deu aos projetistas de processadores uma vergonha das riquezas dos transistores, e em nenhum lugar isso é mais aparente do que no processador Nehalem de 45 nm da Intel. Estreando nas variantes de 4 e 8 núcleos ainda este ano, a Nehalem empacota uma tonelada de hardware em um soquete de processador. (Os números anteriores elevam a contagem de transistores de um Nehalem de quatro núcleos em 781 milhões; ainda não havia números para o modelo de 8 núcleos.) Mas tentar alimentar todo esse hardware com a arquitetura de barramento frontal existente na plataforma Intel seria uma loucura. Assim, o mais importante é que Nehalem também parece estar muito atrasado para a arquitetura de ônibus frontalmente geriátrica da Intel.
A mudança radical na situação de largura de banda do sistema da Intel que o novo QuickPath Interconnect (QPI) da Intel representa talvez seja o maior fator isolado que moldou o design da Nehalem. Entre o QuickPath e o controlador de memória integrado da Nehalem, um processador Nehalem terá acesso a uma quantidade sem precedentes de largura de banda agregada, especialmente em implementações de dois e quatro soquetes.
A AMD mudou o controlador de memória para o processador anteriormente e usou o Hypertransport.