Estou tentando resolver um conjunto de equações que possui 40 variáveis independentes (x1, ..., x40) e uma variável dependente (y). O número total de equações (número de linhas) é ~ 300, e eu quero resolver o conjunto de 40 coeficientes que minimizam o erro total da soma dos quadrados entre y e o valor previsto.
Meu problema é que a matriz é muito esparsa e não sei a melhor maneira de resolver o sistema de equações com dados esparsos. Um exemplo do conjunto de dados é mostrado abaixo:
y x1 x2 x3 x4 x5 x6 ... x40
87169 14 0 1 0 0 2 ... 0
46449 0 0 4 0 1 4 ... 12
846449 0 0 0 0 0 3 ... 0
....
Atualmente, estou usando um algoritmo genético para resolver isso e os resultados estão saindo com aproximadamente um fator de duas diferenças entre o observado e o esperado.
Alguém pode sugerir diferentes métodos ou técnicas capazes de resolver um conjunto de equações com dados esparsos.