Eu diria que os pré-requisitos mais importantes para o Machine Learning são Álgebra Linear , Otimização (numérica e teórica) e Probabilidades .
Se você ler os detalhes das implementações de algoritmos comuns de aprendizado de máquina (eu tenho em mente o LASSO, Elastic Net, SVMs), as equações dependem fortemente de várias identidades (forma dupla de um problema de otimização, várias fórmulas decorrentes da álgebra linear) e a implementação exige que você esteja familiarizado com técnicas como descida de gradiente.
As probabilidades são essenciais na Estrutura de aprendizado do PAC e toda vez que você estuda testes.
Então, somente então, a análise funcional pode ser útil. Especialmente quando você está estudando kernels (e usa teoremas de representação).
Em relação à análise complexa, não conheço o uso principal de teoremas importantes decorrentes desse campo no aprendizado de máquina (alguém me corrija se eu estiver errado).