Estou fazendo uma diagonalização de Lanczos de uma grande matriz esparsa (~ 2 milhões de elementos). Quase todas as etapas do algoritmo Lanzcos são realizadas em paralelo na GPU, exceto na diagonalização da matriz de Lanczos para verificar a convergência. Para isso, tenho usado o algoritmo TQLI da Numerical Recipes. Existem métodos para encontrar o sistema próprio de uma matriz tridiagonal que seja paralela ou facilmente paralelizável? Existe uma versão paralela do TQLI?