Ao ler um livro sobre regressão, encontrei o seguinte parágrafo:
A estimativa dos mínimos quadrados de um vetor de coeficientes de regressão linear ( ) é
que, quando visto como uma função dos dados (considerando os preditores X como constantes), é uma combinação linear dos dados. Usando o Teorema do Limite Central, pode ser demonstrado que a distribuição de β será aproximadamente multivariada normal se o tamanho da amostra for grande.
Definitivamente, estou perdendo algo no texto, mas não entendo como um único valor pode ter uma distribuição? Como os múltiplos valores de β são gerados para obter a distribuição mencionada no texto?
4
é o vetor de coeficientes de regressão - isso esclarece a confusão?
—
Macro
@ Taylor Mas como você sabe a distribuição de B se a única coisa que sei é que o "tamanho da amostra é grande"?
—
upabove 17/05/12
@ Taylor O componente individual do beta-fatorator terá distribuição apenas se o componente de erro no modelo de regressão for gaussiano com 0 média e variância constante. No caso não normal, você não conheceria necessariamente sua distribuição sob a hipótese nula, mas ainda assim pode ser assintoticamente normal. No entanto, como whuber afirma, o teorema do limite central pode não se sustentar porque é uma média ponderada e precisamos saber que os pesos não mudam com o tamanho da amostra de uma maneira que permita que alguns termos dominem a soma.
—
Michael R. Chernick