Eu acho que há alguma evidência empírica que apóia a citação de Gates. Lembro-me de ler (embora não me lembre da fonte) que, nos pools de digitação, a diferença na saída (facilmente mensurável para um pool de digitação) entre aqueles no percentil 5 e aqueles no percentil 95% era algo como 3 a 1. Mas depois que o software de processamento de texto ficou disponível, a proporção subiu para algo entre 10 ou 20 para 1, porque aqueles que podiam usar os recursos avançados do software ganharam ainda mais vantagens relativas.
Presumivelmente, para o desenvolvimento de software, a proporção seria ainda maior, pois há ainda mais liberdade para tirar proveito de todos os tipos de ferramentas, técnicas, etc. É mais difícil medir as diferenças, mas a maioria das tentativas ocorre com pelo menos 10 para 1 e presumivelmente isso está subestimando a diferença, porque está apenas medindo o que é fácil de medir.
Em algo como digitar ou operar um torno, as pessoas no top 1% provavelmente estão muito perto de atingir os limites fisiológicos do que é possível. No caso da programação, eles claramente não são (a proporção de quanto tempo leva para escrever o código versus quanto tempo leva para digitar o código é enorme), portanto, deve haver espaço para muito mais variações.