Estou pensando em acelerar os produtos vetoriais de matriz, mas tudo o que leio é sobre como fazer isso para matrizes muito grandes. No meu caso, as matrizes são pequenas, mas o número de vezes que isso deve ser feito é muito grande.
Quais métodos, se houver, existem para otimizar isso? Seria mais rápido construir uma matriz de blocos diagonal realmente grande a partir das matrizes pequenas e um vetor grande composto por vetores menores e usar as técnicas para as grandes acelerações de vetores matriciais? Ou a criação da matriz global e do vetor mataria algum benefício lá?