Como usar o anova para comparação de dois modelos?

Como devo entender o anovaresultado ao comparar dois modelos?

Exemplo:

  Res.Df    RSS Df Sum of Sq      F    Pr(>F)    
1      9 54.032                                  
2      7  4.632  2      49.4 37.329 0.0001844 ***

A página de manual declara: "Computar tabelas de análise de variação (ou desvio) para um ou mais objetos de modelo ajustados". No entanto, um professor mencionou que pode ser empregado para comparação de modelos - é isso que pretendo fazer.

Por isso, presumo que eu poderia usar anova(model1, model2)e obter um valor-p que me diz se devo rejeitar a hipótese nula: "os modelos são os mesmos".

Posso afirmar que, se o valor-p for menor que (digamos) 0,05, os modelos diferem significativamente?

r regression anova

— petrbel
fonte

No seu exemplo, model1 e model2 estão aninhados? Ou seja, ambos os modelos têm um conjunto compartilhado de variáveis preditivas e a mesma variável de resultado, mas um modelo possui uma ou mais variáveis preditivas adicionais?

— EdM

Um é como Y ~ X + X^2e o segundoY ~ X + X^2 + X^3

— petrbel

Supondo que seus modelos estão aninhados (ou seja, a mesma variável de resultado e o modelo 2 contém todas as variáveis do modelo 1 mais 2 variáveis adicionais), os resultados da ANOVA indicam que as 2 variáveis adicionais representam conjuntamente uma variação suficiente para que você possa rejeitar a hipótese nula de que o coeficientes para ambas as variáveis são iguais a 0. Isso é efetivamente o que você disse. Se ambos os coeficientes forem iguais a 0, os modelos serão os mesmos.

$Model 1: y=a+bx_1+cx_2+dx_3; Model 2: y=a+bx_1+cx_2$ $x_3$ car::Anovaanova

— le_andrew
fonte

Se eu entendi direito, o valor de p menor que 0,05 prova que os modelos são diferentes, justos?

— Petrbel

Eu não usaria essas palavras (ou seja, "prove" e "modelos diferem"), mas queremos dizer a mesma coisa. Eu diria que seus dados não suportam a hipótese nula de que os coeficientes são ambos 0 ou que os dados suportam a hipótese alternativa de que os coeficientes não são os dois 0

— le_andrew

Antes de se afirmar que os modelos são diferentes ou que a hipótese nula não é suportada, certifique-se de que os dados atendam razoavelmente às suposições da ANOVA subjacentes ao cálculo e interpretação dos valores de p.

— EdM

Só para ter certeza, a última parte sobre a soma dos quadrados do tipo I se aplica apenas à situação em que anova()é usado em um modelo?

— Jasper