Ao contrário de muitas circunstâncias em um computador, por exemplo, endereçamento, em que aumentar o tamanho do endereço em um bit aumenta a quantidade de memória endereçável em uma potência de 2 (e por que as potências de 2 são tão comuns na memória), o tamanho real da palavra da CPU pode ser qualquer valor conveniente.
Os comprimentos comuns de palavras para processadores (16, 32 e 64 bits) surgiram na verdade como múltiplos de 8 (em vez de potências de 2, embora, é claro, esses múltiplos particulares de 8 também sejam potências de 2), sendo 8 bits o tamanho mínimo para um único caractere , o menor tipo de dados primitivo comumente usado.
Como 8 bits é impreciso demais para ser muito útil para valores numéricos (ou mesmo para conjuntos de caracteres estendidos como UTF-16), palavras maiores que 8 bits permitem uma eficiência muito maior ao trabalhar com valores que utilizam mais do que muitos bits de precisão , e múltiplos de 8 bits (o menor tipo de dados comumente usado) ainda são a escolha natural, permitindo armazenar uma quantificação inteira de (por exemplo, 2, 4 ou 8) caracteres em uma palavra sem deixar bits desperdiçados e não utilizados.
O artigo da wikipedia sobre palavras possui uma seção Escolha de tamanho de palavra com um pouco mais de detalhes.