Os processadores modernos têm clock de clock: cada operação requer um número integral de ciclos de clock. Os projetistas do processador determinam a duração de um ciclo de clock. Existem duas considerações: Uma, a velocidade do hardware, por exemplo, medida como o atraso de um único gate NAND. Isso depende da tecnologia usada e de compensações como velocidade versus uso de energia. É independente do design do processador. Segundo, os projetistas decidem que a duração de um ciclo de clock é igual a n atrasos de um único gate NAND, onde n pode ser 10 ou 30 ou qualquer outro valor.
Essa opção n limita a complexidade das operações que podem ser processadas em um ciclo. Haverá operações que podem ser feitas em 16, mas não em 15 atrasos NAND. Portanto, escolher n = 16 significa que essa operação pode ser realizada em um ciclo, escolhendo n = 15 significa que não pode ser realizada.
Os projetistas escolherão n para que muitas operações importantes possam ser realizadas em um ou em dois ou três ciclos. n será escolhido localmente ideal: se você substituísse n por n-1, a maioria das operações seria um pouco mais rápida, mas algumas (aquelas que realmente precisam de todos os atrasos n na NAND) seriam mais lentas. Se poucas operações desacelerassem, para que a execução geral do programa fosse mais rápida, em média, você escolheria n-1. Você também pode ter escolhido n + 1. Isso torna a maioria das operações um pouco mais lentas, mas se você tiver muitas operações que não podem ser realizadas com n atrasos, mas que podem ser realizadas com n + 1 atrasos, isso tornaria o processador mais rápido.
Agora sua pergunta: adicionar e subtrair são operações tão comuns que você deseja poder executá-las em um único ciclo. Como resultado, não importa que AND, OR etc. possam executar mais rapidamente: eles ainda precisam desse ciclo. É claro que a unidade "calculando" AND, OR etc tem muito tempo para mexer os polegares, mas isso não pode ser ajudado.
Observe que não é apenas se uma operação pode ser realizada com n atrasos NAND ou não: uma adição, por exemplo, pode ser feita mais rapidamente sendo um pouco inteligente, ainda mais rápida por ser muito inteligente, ainda mais rápida, investindo quantidades extraordinárias de hardware e, finalmente, um processador pode ter uma mistura de circuitos muito rápidos, muito caros e um pouco mais lentos e mais baratos; portanto, há a possibilidade de fazer uma operação com rapidez suficiente, gastando mais dinheiro com isso.
Agora você pode tornar a velocidade do relógio tão alta / o ciclo tão curto que apenas as operações simples de bits são executadas em um ciclo e todo o resto em dois ou mais. Isso provavelmente atrasaria o processador. Para operações que levam dois ciclos, geralmente há sobrecarga para mover uma instrução incompleta de um ciclo para o próximo, portanto, dois ciclos não significa que você tem o dobro do tempo para execução. Então, para fazer a adição em dois ciclos, você não pode dobrar a velocidade do relógio.