A AMD apareceu recentemente nas notícias com uma interessante placa Radeon Pro com alguns SSDs M2 nela.
Como observam algumas das histórias mais detalhadas ( aqui ou aqui , por exemplo), os benefícios podem não resultar principalmente de alta largura de banda (os M2 são apenas de 4 pistas PCIe cada, portanto o conector de 16 pistas da placa deve ter mais), mas de baixa latência. Esta história inclui a afirmação "isso resulta em uma latência de acesso à memória 10x mais baixa".
Minha pergunta é basicamente: por que os SSDs conectados à PCIe na placa GPU têm significativamente menos latência do que a GPU que acessa a RAM do sistema principal ou os dispositivos de armazenamento no barramento PCIe do sistema? O que há no sistema principal que "atrapalha" e significa que os SSDs integrados podem ser muito mais rápidos de acessar?