A abordagem que você mostra é uma topologia bastante antiga para placas-mãe - ela é anterior ao PCIe, que realmente o coloca de volta em algum lugar dos anos 2000. O motivo é principalmente devido às dificuldades de integração.
Basicamente, há 15 anos, a tecnologia para integrar tudo em um único molde era praticamente inexistente do ponto de vista comercial, e isso era incrivelmente difícil. Integrar tudo resultaria em tamanhos de matriz de silício muito grandes, o que, por sua vez, leva a um rendimento muito menor. O rendimento é essencialmente quantas matrizes você perde em uma bolacha devido a defeitos - quanto maior o dado, maior a probabilidade de um defeito.
Para combater isso, basta dividir o design em vários chips - no caso de placas-mãe, isso acabou sendo CPU, North Bridge e South Bridge. A CPU é limitada apenas ao processador com uma interconexão de alta velocidade (conhecida como barramento frontal, tanto quanto me lembro). Você tem a Ponte Norte, que integra o controlador de memória, a conexão gráfica (por exemplo, AGP, uma tecnologia antiga em termos de computação) e outro link mais lento para a Ponte Sul. A ponte sul foi usada para lidar com placas de expansão, discos rígidos, unidades de CD, áudio etc.
Nos últimos 20 anos, a capacidade de fabricar semicondutores em nós de processo cada vez menores, com confiabilidade cada vez maior, significa integrar tudo em um único chip. Transistores menores significam maior densidade, para que você possa se encaixar mais, e processos aprimorados na fabricação significam maior rendimento. Na verdade, além de ser mais econômico, tornou-se vital manter os aumentos de velocidade nos computadores modernos.
Como você apontou corretamente, ter uma interconexão com uma ponte norte se torna um gargalo. Se você pode integrar tudo à CPU, incluindo o PCIe Root Complex e o controlador de memória do sistema, de repente você tem um link de velocidade extremamente alta entre os principais dispositivos gráficos e de computação - no PCB, talvez você esteja falando de velocidades da ordem de Gbps, o dado que você pode atingir velocidades da ordem dos Tbps!
Essa nova topologia é refletida neste diagrama:
Fonte da imagem
Nesse caso, como você pode ver, os controladores gráficos e de memória são integrados ao chip da CPU. Enquanto você ainda tem um link para o que é efetivamente um único chipset feito de alguns bits da ponte norte e da ponte sul (o chipset no diagrama), isso hoje em dia é interconectado incrivelmente rápido - talvez 100 + Gbps. Ainda mais lento que no dado, mas muito mais rápido que os antigos ônibus da frente.
Por que não apenas integrar absolutamente tudo? Os fabricantes de placas-mãe ainda querem alguma personalização - quantos slots PCIe, quantas conexões SATA, qual controlador de áudio etc.
De fato, alguns processadores móveis se integram ainda mais aos computadores de placa única de CPU, com variantes de processador ARM. Nesse caso, como o ARM concede o design da CPU, os fabricantes ainda podem personalizar suas matrizes conforme entenderem e integrar os controladores / interfaces que desejarem.