Sim, é possível.
Se a matriz de dados não se encaixa na RAM, ainda não é o fim do mundo: existem algoritmos eficientes que podem trabalhar com dados armazenados em um disco rígido. Veja, por exemplo, PCA randomizado, conforme descrito em Halko et al., 2010, Um algoritmo para a análise de componentes principais de grandes conjuntos de dados .
Na Seção 6.2, os autores mencionam que tentaram seu algoritmo na matriz de dados 400k vezes 100k e que
O algoritmo do presente trabalho levou 12,3 horas para processar todos os 150 GB desse conjunto de dados armazenados em disco, usando o laptop com 1,5 GB de RAM [...].
Observe que isso acontecia nos velhos tempos dos discos rígidos magnéticos; hoje existem unidades de estado sólido muito mais rápidas disponíveis, então acho que o mesmo algoritmo teria um desempenho consideravelmente mais rápido.
Veja também este tópico antigo para obter mais discussões sobre o PCA aleatório: o melhor algoritmo do PCA para um grande número de recursos (> 10K)? e esta grande revisão de 2011 de Halko et al .: Encontrando estrutura com aleatoriedade: algoritmos probabilísticos para a construção de decomposições aproximadas de matrizes .