A menos que a solução de formulário fechado seja extremamente cara de calcular, geralmente é o caminho a seguir quando está disponível. Contudo,
Para a maioria dos problemas de regressão não linear, não há solução de forma fechada.
Mesmo em regressão linear (um dos poucos casos em que uma solução de formulário fechado está disponível), pode ser impraticável usar a fórmula. O exemplo a seguir mostra uma maneira pela qual isso pode acontecer.
Para regressão linear em um modelo da forma , em que é uma matriz com classificação completa da coluna, a solução dos mínimos quadrados,y=XβX
β^=argmin∥Xβ−y∥2
É dado por
β^=(XTX)−1XTy
Agora, imagine que é uma matriz muito grande, mas esparsa. por exemplo, pode ter 100.000 colunas e 1.000.000 linhas, mas apenas 0,001% das entradas em são diferentes de zero. Existem estruturas de dados especializadas para armazenar apenas as entradas diferentes de zero dessas matrizes esparsas. XXX
Imagine também que não temos sorte e é uma matriz bastante densa, com uma porcentagem muito maior de entradas diferentes de zero. Armazenar uma matriz densa de 100.000 por 100.000 elementos exigiria números de ponto flutuante (a 8 bytes por número, isso chega a 80 gigabytes). Isso seria impraticável para armazenar qualquer coisa mas um supercomputador. Além disso, o inverso dessa matriz (ou mais comumente um fator de Cholesky) também tenderia a ter entradas na maioria diferentes de zero. XTXXTX1×1010
No entanto, existem métodos iterativos para resolver o problema dos mínimos quadrados que não necessitam de mais espaço de armazenamento do que , , e e nunca formar explicitamente o produto matriz . Xyβ^XTX
Nessa situação, usar um método iterativo é muito mais eficiente em termos computacionais do que usar a solução de formulário fechado para o problema dos mínimos quadrados.
Este exemplo pode parecer absurdamente grande. No entanto, grandes problemas esparsos de mínimos quadrados desse tamanho são rotineiramente resolvidos por métodos iterativos em computadores de mesa em pesquisas de tomografia sísmica.