O SQL permite que você persista e faça muitas transações de relações diferentes e sempre a disponibilize prontamente para vários usos diferentes. Essencialmente, uma fonte de verdade ou lugar para ir. Há sobrecarga, com certeza. No entanto, algumas análises podem ser muito complicadas e requerem uma quantidade significativa de operações baseadas em conjuntos, que podem transformar até mesmo um conjunto pequeno de dados em um grande, muito rapidamente. Eu tive processos de dados que têm mais de 2000 consultas que processam terabytes em menos de 5 minutos e podem pontuar bilhões de registros para um modelo preditivo no final, e python e numpy pontuaram uma fração do conjunto de dados em 10 vezes como armazenamento de dados relacional e servi-lo até uma camada de apresentação.
Um ponto adicional, se você fizer isso na nuvem, verifique se possui uma instância dinâmica que pode dimensionar sua memória. Com o SQL, trata-se de ter disco e computação suficiente para fazê-lo em tempo hábil.
Eu vejo muitas maneiras pelas quais eles podem trabalhar em sinergia. Muitos trabalhos de ciência de dados são o que o Pandas foi projetado para fazer. Alguns trabalhos de ciência de dados são o que os RDBs foram projetados para fazer. Use os dois em equilíbrio.
É tudo sobre a ferramenta certa para fazer o trabalho certo.