Então, eu aprendi recentemente sobre o Compute Shader e parece que tive a mesma idéia que a programação paralela que você faria com CUDA ou OpenCL, mas no pipeline do shader.
Se eu quiser desenhar um milhão de cubos em uma cena, devo usar um método sobre o outro ou ambos. Se ambos, como você divide isso, a GPU não está tentando calcular paralelamente o shader e outro processo ao mesmo tempo