Existem (pelo menos) três sentidos nos quais uma regressão pode ser considerada "linear". Para distingui-los, vamos começar com um modelo de regressão extremamente geral
Y=f(X,θ,ε).
Para manter a discussão simples, considere as variáveis independentes como fixas e medidas com precisão (em vez de variáveis aleatórias). Eles modelar observações de atributos cada, dando origem a o -vector de respostas . Convencionalmente, é representado como uma matriz e como um vetor coluna . O ( vetor- finito ) compreende os parâmetros . é uma variável aleatória com valor vetorial. Geralmente temn p n Y X n × p Y nXnpnYXn×pYnθqθnεncomponentes, mas às vezes tem menos. A função é com valor vetorial (com componentes para corresponder a ) e geralmente é assumida contínua nos dois últimos argumentos ( e ).n Y θfnYθε
O exemplo arquetípico , de ajustar uma linha aos dados , é o caso em que é um vetor de números - os valores x; é um vetor paralelo de números ; fornece a interceptação e slope ; e é um vetor de "erros aleatórios" cujos componentes são independentes (e geralmente assumidos como tendo distribuições idênticas mas desconhecidas do valor médio zero). Na notação anterior,X( x , y)XY N ( y i ) θ = ( α , β ) α β ε = ( ε 1 , ε 2 , ... , ε n )( xEu,i = 1 , 2 , … , n )Yn( yEu)θ = ( α , β)αβε = ( ε1 1, ε2, … , Εn)
yEu= α + βxEu+ εEu= f( X, θ , ε )Eu
com .θ = ( α , β)
A função de regressão pode ser linear em qualquer um (ou todos) de seus três argumentos:
"Regressão linear, ou um" modelo linear ", normalmente significa que é linear em função dos parâmetros . O significado do SAS de" regressão não linear " é nesse sentido, com a suposição adicional de que é diferenciável em seu segundo argumento (os parâmetros). Essa suposição facilita a localização de soluções.f θf
Uma "relacionamento linear entre e " significa é linear como uma função de .Y f XXYfX
Um modelo apresenta erros aditivos quando é linear em . Nesses casos, sempre se assume que . (Caso contrário, não seria correto pensar em como "erros" ou "desvios" dos valores "corretos".)ε E ( ε ) = 0 εfεE (ε)=0ε
Toda combinação possível dessas características pode acontecer e é útil. Vamos examinar as possibilidades.
Um modelo linear de um relacionamento linear com erros aditivos. Esta é uma regressão comum (múltipla), já exibida acima e mais geralmente escrita como
Y= Xθ + ε .
X foi aumentado, se necessário, adjacente a uma coluna de constantes e é um vetor .θp
Um modelo linear de um relacionamento não linear com erros aditivos. Isso pode ser expresso como uma regressão múltipla aumentando as colunas de com funções não lineares do próprio X. Por exemplo,XX
yi=α+βx2i+ε
é desta forma. É linear em ; possui erros aditivos; e é linear nos valores ( 1 , x 2 i ), mesmo que x 2 i seja uma função não linear de x i .θ=(α,β)(1,x2i)x2ixi
Um modelo linear de um relacionamento linear com erros não aditivos. Um exemplo é erro multiplicativo,
yi=(α+βxi)εi.
(Nesses casos, pode ser interpretado como "erro multiplicativo" quando a localização de ε i é 1. No entanto, o senso adequado de localização não é mais necessariamente a expectativa E ( ε i ) : pode ser a mediana ou a média geométrica, por exemplo. Um comentário semelhante sobre premissas de localização também se aplica, mutatis mutandis , em todos os outros contextos de erro não-aditivo.)εiεi1E(εi)
Um modelo linear de um relacionamento não linear com erros não aditivos. Por exemplo ,
yi=(α+βx2i)εi.
Um modelo não linear de uma relação linear com erros aditivos. Um modelo não linear envolve combinações de seus parâmetros que não apenas não são lineares, como também não podem ser linearizadas reexpressando os parâmetros.
Como um não exemplo, considere
yi=αβ+β2xi+εi.
Definindo e β ′ = β 2 e restringindo β ′ ≥ 0 , este modelo pode ser reescritoα′=αββ′=β2β′≥0
yi=α′+β′xi+εi,
exibindo-o como um modelo linear (de uma relação linear com erros aditivos).
Como exemplo, considere
yi=α+α2xi+εi.
É impossível encontrar um novo parâmetro , dependendo de α , que o linearize como uma função de α ′ (mantendo-o linear em x i ).α′αα′xi
Um modelo não linear de um relacionamento não linear com erros aditivos.
yi=α+α2x2i+εi.
Um modelo não linear de um relacionamento linear com erros não aditivos.
yi=(α+α2xi)εi.
Um modelo não linear de um relacionamento não linear com erros não aditivos.
yi=(α+α2x2i)εi.
Embora exibam oito formas distintas de regressão, elas não constituem um sistema de classificação porque algumas formas podem ser convertidas em outras. Um exemplo padrão é a conversão de um modelo linear com erros não aditivos (supostamente com suporte positivo)
yi=(α+βxi)εi
em um modelo linear de uma relação não linear com erros aditivos via logaritmo,
log(yi)=μi+log(α+βxi)+(log(εi)−μi)
Aqui, a média geométrica do log foi removida dos termos de erro (para garantir que eles tenham médias zero, conforme necessário) e incorporada nos outros termos (onde seu valor precisará ser estimado ) De fato, uma das principais razões para reexprimir a variável dependente Y é criar um modelo com erros aditivos. A re-expressão também pode linearizar Y como uma função de um (ou de ambos) dos parâmetros e variáveis explicativas.μi=E(log(εi))YY
Colinearidade
A colinearidade (dos vetores da coluna em ) pode ser um problema em qualquer forma de regressão. A chave para entender isso é reconhecer que a colinearidade leva a dificuldades na estimativa dos parâmetros. Abstrata e bastante geralmente, compare dois modelos Y = f ( X , θ , ε ) e Y = f ( X ′ , θ , ε ′ ) onde X ′ é X com uma coluna ligeiramente alterada. Se isso induz enormes mudanças nas estimativasXY=f(X,θ,ε)Y=f(X′,θ,ε′)X′X e θ ', então, obviamente, nós temos um problema. Uma maneira pela qual esse problema pode surgir é em um modelo linear, linear emX(ou seja, tipos (1) ou (5) acima), onde os componentes deθestão em correspondência um-a-um com as colunas deX. Quando uma coluna é uma combinação linear não trivial das outras, a estimativa do seu parâmetro correspondente pode ser qualquer número real. Esse é um exemplo extremo de tal sensibilidade.θ^θ^′XθX
Deste ponto de vista, deve ficar claro que a colinearidade é um problema potencial para modelos lineares de relações não lineares (independentemente da aditividade dos erros) e que esse conceito generalizado de colinearidade é potencialmente um problema em qualquer modelo de regressão. Quando você tem variáveis redundantes, terá problemas para identificar alguns parâmetros.