Relatando resultados de regressão linear simples: quais informações incluir?


11

Acabei de realizar uma regressão linear (muito) simples em Genstat e gostaria de incluir um resumo sucinto e significativo da saída no meu relatório. Não sei exatamente o que ou quanto das informações devo incluir.

Os principais bits da minha saída Genstat são assim:

Summary of analysis 
Source      d.f.    s.s.       m.s.       v.r.    F pr.
Regression    1   8128935.   8128935.    814.41   <.001
Residual     53    529015.      9981.        
Total        54   8657950.    160332.        

Percentage variance accounted for 93.8
Standard error of observations is estimated to be 99.9.

Estimates of parameters 
Parameter    estimate    s.e.     t(53)   t pr.
Constant      41.5      30.7       1.35   0.182
UKHR_Ref       0.8659    0.0303   28.54   <.001

Pretendia relatar isso simplesmente como:

Adjusted R2 = 0.94 (slope = 0.87, p < 0.001; intercept not significantly different from 0).

mas um colega sugeriu que eu também incluísse pelo menos o root mean squared error(que acredito que neste caso seja igual ao erro padrão das observações, isto é, 99,9?).

A inclusão do RMSE fornece informações úteis adicionais ou a qualidade do ajuste já está adequadamente explicada pelo valor de R2 ajustado?

Existem regras rígidas e rápidas para quanta informação reportar ou é bastante subjetiva?

Muito obrigado!


11
"Existem regras rígidas e rápidas para a quantidade de informações a serem relatadas" - isso realmente depende do que você deseja fazer após a regressão. Pode-se estar feliz apenas com o coeficiente de correlação; pode ser necessário o valor de Durbin-Watson, e ainda outro pode querer ver a diagonal da matriz do chapéu ... isso realmente depende.
JM não é um estatístico

2
Algumas organizações têm regras. Veja as diretrizes da APA, por exemplo.
whuber

Respostas:


6

Para uma regressão linear simples, eu sempre produzia um gráfico da variável x em relação à variável y, com a linha de regressão sobreposta ao gráfico (sempre plote seus dados sempre que possível!). Isso mostrará com muita facilidade o quão bem o seu modelo se encaixa e é fácil de ler para uma regressão de 1 variável. Adicionar isso ao que você já tem provavelmente seria suficiente, embora você possa incluir alguns gráficos de diagnóstico (alavancagem, distância de cozimento, resíduos, etc.). Depende de quão bom é o enredo xy, do público-alvo e de quaisquer protocolos esperados pelo público.

R2

R2±±2R2


Obrigado @probabilityislogic. Incluí uma trama no meu relatório e parece que, além disso, minha sentença original deve ser suficiente nesse caso. Acho que incluir plotagens de diagnóstico provavelmente não é necessário para esse público, embora eu tenha obviamente verificado isso pessoalmente e eles pareçam razoáveis. Obrigado também pela explicação de R2 vs. RMSE - é muito útil.
jamess

E quanto aos valores t e df (s)? Quando estas devem ser incluídas? Faz sentido incluir os dois ou nenhum?
noz sobre natty

1

Utilizo para relatar o coeficiente β mais o IC95%, o valor de p e o Rsquared ajustado. Ex:

(β = 1,46, IC 95% [1,19, 1,8], p = 0,001 **, R2 ajustado = 0,48)

Ao relatar uma regressão múltipla ou uma regressão com variáveis ​​fatoriais, relato o coeficiente, o IC de 95%, os valores de p e, em seguida, separadamente as estatísticas F (degres de liberdade), o R2 ajustado e o valor de p do modelo.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.