Qual a importância da distinção entre modelos lineares e não lineares? A questão Modelo linear não linear versus generalizado: Como você se refere à regressão logística, de Poisson etc.? e sua resposta foi um esclarecimento extremamente útil da linearidade / não linearidade dos modelos lineares generalizados. Parece criticamente importante distinguir modelos lineares e não lineares, mas não está claro para mim por que? Por exemplo, considere estes modelos de regressão:
Os modelos 1 e 2 são lineares e as soluções para existem na forma fechada, facilmente encontradas usando um estimador OLS padrão. Não é o caso para os modelos 3 e 4, que não são lineares porque (algumas das) derivadas de E [ Y ∣ X wrt β ainda são funções de β .
Uma solução simples para estimar no Modelo 3 é linearizar o modelo configurando γ = β 2 1 , estimar γ usando um modelo linear e depois calcular β 1 = √ .
Para estimar os parâmetros no Modelo 4, podemos assumir que segue uma distribuição binomial (membro da família exponencial) e, usando o fato de a forma logística do modelo ser o link canônico, linearizar os rhs do modelo. Essa foi a contribuição seminal de Nelder e Wedderburn .
Mas por que essa não linearidade é um problema em primeiro lugar? Por que não se pode simplesmente usar algum algoritmo iterativo para resolver o Modelo 3 sem linearizar usando a função de raiz quadrada, ou o Modelo 4 sem chamar GLMs. Suspeito que, antes do amplo poder computacional, os estatísticos tentassem linearizar tudo. Se for verdade, talvez os "problemas" introduzidos pela não linearidade sejam um remanescente do passado? As complicações introduzidas pelos modelos não lineares são meramente computacionais ou existem outras questões teóricas que tornam os modelos não lineares mais difíceis de serem ajustados aos dados do que os modelos lineares?