Existe teste formal de não linearidade na regressão linear?


8

Na regressão logística, há Box-Tidwell, mas não sei nada disso na regressão linear. Uso plotagens residuais parciais para procurar isso, um recurso gráfico, mas gostaria de encontrar um teste formal (na honestidade, duvido que você possa fazer um teste formal disso, mas posso estar errado).



Para o modelo , não é um teste formal para todos os vs ? Isso é semelhante a um teste F da ANOVA. y=β0+jβjxj+εH0:βj=0jH1:not H0
StubbornAtom

Respostas:


10

O Box-Tidwell foi desenvolvido para modelos comuns de regressão de mínimos quadrados.

Portanto, se você estava inclinado a usar o Box-Tidwell para isso, é para isso que ele foi projetado.

Não é a única abordagem possível, mas parece uma abordagem com a qual você já está familiarizado.

No entanto, não estou convencido de que (na maioria das vezes seja usado) um teste formal seja apropriado - acredito que ele geralmente responda à pergunta errada, enquanto os gráficos de diagnóstico que você está observando se aproximam de responder a uma pergunta útil. [Eu tenho uma opinião semelhante sobre muitos outros testes de suposições de regressão]


4
Eu estaria melhor com uma especificação diferente? Geralmente é uma boa pergunta, mas difícil de resolver, exceto muito especificamente. (Pun não realmente a intenção, mas parece para atender o caso.)
Nick Cox

@Glen_b Você poderia indicar as perguntas "erradas" e "úteis" às quais se refere? Obrigado.
Rolando2

4
A hipótese que está sendo testada é a linearidade exata - o que quase nunca será o caso. Se não conseguirmos rejeitar, tudo o que aprendemos foi que nossa amostra era pequena demais para detectar a não linearidade, não que seu efeito fosse pequeno. Se rejeitarmos, não estamos em melhor situação, aprendemos o que já sabíamos, mas se a não linearidade é pequena, é de pouca importância. O teste ainda não nos diz se a não linearidade realmente importa ; o que precisávamos saber é quanta diferença a não linearidade que temos faz à nossa inferência.
Glen_b -Reinstate Monica

Um problema que tenho, porque trabalho normalmente com toda a população em questão, é que tenho milhares de pontos de dados. Eles tendem a parecer grandes bolhas nos resíduos, por isso é difícil discernir padrões na regressão; eles não representam muito bem o que você vê nos livros de texto.
User54285 01/01/19

11
1. Com uma amostra grande, isso constituiria a base de uma pergunta (prontamente respondida) (como ver a não linearidade em um gráfico residual nessas circunstâncias); idealmente, adicionar um gráfico de exemplo que lhe daria dificuldade. 2. Se você se encaixa em toda a população de interesse, as noções de teste saem pela janela (você certamente não tem uma amostra aleatória!). Você literalmente tem tudo o que deseja fazer inferências, apenas calcule o que precisa.
Glen_b -instala Monica

6

Os melhores testes formais vêm do relaxamento da suposição de linearidade e, em seguida, ver se a remoção das não linearidades danifica a variação explicada em Y. Por exemplo, você pode expandir X usando um spline de regressão e testar os componentes não lineares. Minhas notas do curso RMS entram em detalhes.

Porém, depois de permitir a possibilidade de não linearidade, distorce a inferência estatística removendo os termos não lineares. Os graus reais de liberdade do numerador para a regressão são o número de chances de fornecer o modelo, que deve levar em consideração os termos não lineares. Portanto, o melhor conselho geral é permitir que efeitos não conhecidos como lineares sejam não-lineares e sejam executados com ele. Isso preservará a cobertura do intervalo de confiança, etc.


2
(+1) No momento, o link leva a um erro "Página não encontrada".
COOLSerdash

"Portanto, o melhor conselho geral é permitir que efeitos não conhecidos como lineares não sejam lineares e sejam feitos com ele. Isso preservará a cobertura do intervalo de confiança, etc." Não tenho certeza de como você faz isso, mas, em qualquer caso, nas áreas em que trabalho, não existe uma teoria bem desenvolvida (muito pouco em termos de análises estatísticas sofisticadas).
User54285 01/01/19

11
URL corrigida para o link
Frank Harrell

1

Ajuste uma regressão não linear (por exemplo, modelo de spline como GAM) e depois compare-o ao modelo linear usando AIC ou teste de razão de verossimilhança. Este é um método simples e intuitivo de testar a não linearidade. Se o teste rejeitar ou se o AIC preferir o GAM, conclua que não há linearidades.


Essa é uma sugestão interessante do modelo de jogo, mas eu tenho uma pergunta. Eu tenho muitos, digamos 30, preditores no meu modelo. A AIC vai falar sobre o modelo geral. Como eu saberia quais das variáveis ​​individuais do modelo eram na verdade não lineares?
User54285 07/07/19
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.