Eu tenho uma pergunta sobre como um estatístico normalmente interpretaria uma saída anova. Digamos que tenho saída anova de R.
> summary(fitted_data)
Call:
lm(formula = V1 ~ V2)
Residuals:
Min 1Q Median 3Q Max
-2.74004 -0.33827 0.04062 0.44064 1.22737
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.11405 0.32089 6.588 1.3e-09 ***
V2 0.03883 0.01277 3.040 0.00292 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.6231 on 118 degrees of freedom
Multiple R-squared: 0.07262, Adjusted R-squared: 0.06476
F-statistic: 9.24 on 1 and 118 DF, p-value: 0.002917
> anova(fit)
Analysis of Variance Table
Response: V1
Df Sum Sq Mean Sq F value Pr(>F)
V2 1 3.588 3.5878 9.2402 0.002917 **
Residuals 118 45.818 0.3883
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Pelo exposto, acho que o valor mais importante é Pr (> F), certo? Portanto, este Pr é menor que 0,05 (nível de 95%). Como meu "explica" isso? Eu explico isso em "associação", ou seja, V2 e V1 estão associados (ou não)? ou em termos de "significado"? Sempre achei que não conseguia entender quando as pessoas dizem "Esse valor é significativo ...". Então, o que é "significativo"? Existe uma forma mais intuitiva de explicação? como "Estou 95% confiante de que ....".
Além disso, o valor Pr é a única informação importante? ou também posso olhar para os resíduos e o restante da saída para "explicar" o resultado? obrigado
fitted_data