O que é a relação entre

17

Eu queria saber se existe uma relação entre e um teste-F. $R^2$

Normalmente,

R^{2} = \frac{\sum ({\hat{Y}}_{t} - \bar{Y})^{2} / T - 1}{\sum (Y_{t} - \bar{Y})^{2} / T - 1}

$R^2=\frac {\sum (\hat Y_t - \bar Y)^2 / T-1} {\sum( Y_t - \bar Y)^2 / T-1}$ e mede a intensidade da relação linear na regressão.

Um teste F apenas prova uma hipótese.

Existe uma relação entre $R^2$ e F-Test?

— Le Max
fonte

2

A fórmula para

R^{2}

$R^2$ aparência incorreta, não só porque está faltando alguns caracteres no denominador: aqueles "

- 1

$-1$ " termos não pertencem. A fórmula correta se parece muito mais com uma estatística

F

$F$ :-).

— whuber

Veja stats.stackexchange.com/questions/58107/…

— Stéphane Laurent

23

Se todos os pressupostos segurar e você tem a forma correta para , em seguida, a estatística F habitual pode ser calculado como $R^2$ . Esse valor pode ser comparado à distribuição F apropriada para fazer um teste F. Isso pode ser derivado / confirmado com álgebra básica. $F = \frac{ R^2 }{ 1- R^2} \times \frac{ \text{df}_2 }{ \text{df}_1 }$

— Greg Snow
fonte

2

você poderia por favor definir DF1 e DF2?

— bonobo

1

@bonobo, df1 é o grau de liberdade do numerador (com base no número de preditores) e df2 é o grau de liberdade do denominador.

— Greg Neve

1

Para esclarecer mais sobre os graus de liberdade: df1 = k, onde k é o número de preditores. df1 é chamado de "graus de liberdade do numerador", mesmo que esteja no denominador nesta fórmula. df2 = n− (k + 1), em que n é o número de observações e k é o número de preditores. df2 é chamado de "graus de liberdade do denominador", mesmo que esteja no numerador dessa fórmula.

— Tim Swast

5

@GregSnow, você poderia considerar adicionar as definições dos graus de liberdade à resposta? Sugeri essa alteração em stats.stackexchange.com/review/suggested-edits/175306, mas ela foi rejeitada.

— Tim Swast

22

Lembre-se de que em uma configuração de regressão, a estatística F é expressa da seguinte maneira.

F = \frac{(T S S - R S S) / (p - 1)}{R S S / (n - p)}

$F = \frac{(TSS - RSS)/(p-1)}{RSS/(n-p)}$

onde TSS = soma total dos quadrados e RSS = soma residual dos quadrados, é o número de preditores (incluindo a constante) é o número de observações. Esta estatística tem um distribuição com graus de liberdade e $p$ $n$ $F$ $p-1$ $n-p$ .

Lembre-se também de que

R^{2} = 1 - \frac{R S S}{T S S} = \frac{T S S - R S S}{T S S}

$R^2 = 1 - \frac{RSS}{TSS} = \frac{TSS - RSS}{TSS}$

álgebra simples dirá que

R^{2} = 1 - (1 + F \cdot \frac{p - 1}{n - p})^{- 1}

$R^2 = 1 - (1 + F \cdot \frac{p-1}{n-p})^{-1}$

onde F é a estatística F de cima.

Esta é a relação teórica entre a estatística F (ou o teste F) e . $R^2$

A interpretação prática é que um maior conduzem a elevados valores de F, por isso, se for grande (o que significa que um modelo linear se ajusta aos dados assim), então a estatística F correspondente deve ser grande, o que significa que não deva Há fortes evidências de que pelo menos alguns dos coeficientes são diferentes de zero. $R^2$ $R^2$

— Zheng Li
fonte

1

Intuitivamente, gosto de pensar que o resultado da razão F primeiro dá uma resposta sim-não à pergunta 'posso rejeitar ?' (é determinado se a razão for muito maior que 1 ou o valor de p < $H_0$ $\alpha$ ).

Então, se eu determinar, posso rejeitar , $H_0$ $R^2$ , em seguida indica a força da relação entre eles.

Em outras palavras, uma grande proporção F indica que existe um relacionamento. Alto indica quão forte é essa relação. $R^2$

— Entropica
fonte

-1

Além disso, rapidamente:

R2 = F / (F + np / p-1)

Por exemplo, o R2 de um teste de 1df F = 2,53 com tamanho de amostra 21 seria:

R2 = 2,53 / (2,53 + 19) R2 = 0,175

— rystoli
fonte

1

Não vejo como isso acrescenta algo além do que já está na resposta de Zheng Li.

— Glen_b -Reinstala Monica