Perguntas com a marcação «regression»

Técnicas para analisar o relacionamento entre uma (ou mais) variáveis ​​"dependentes" e variáveis ​​"independentes".

1
Por que o erro padrão da interceptação aumenta quanto mais
O erro padrão da intercepção termo ( β 0 ) em Y = β 1 x + β 0 + ε é dado por S E ( β 0 ) 2 = σ 2 [ 1β^0β^0\hat{\beta}_0y=β1x+β0+εy=β1x+β0+εy=\beta_1x+\beta_0+\varepsilonSE(β^0)2=σ2[1n+x¯2∑ni=1(xi−x¯)2]SE(β^0)2=σ2[1n+x¯2∑i=1n(xi−x¯)2]SE(\hat{\beta}_0)^2 = \sigma^2\left[\frac{1}{n}+\frac{\bar{x}^2}{\sum_{i=1}^n(x_i-\bar{x})^2}\right] ondex¯x¯\bar{x}é a média doxixix_i's. Pelo que eu entendo, o SE quantifica o …

1
Interpretação geométrica do modelo linear generalizado
Para o modelo linear , podemos ter uma boa interpretação geométrica do modelo estimado via OLS: . é a projeção de y no espaço medido por xe residual é perpendicular a esse espaço medido por x.y= x β+ey=xβ+ey=x\beta+ey^= x β^+ e^y^=xβ^+e^\hat{y}=x\hat{\beta}+\hat{e}y^y^\hat{y}e^e^\hat{e} Agora, minha pergunta é: existe alguma interpretação geométrica do …

1
Usando MLE vs. OLS
Quando é preferível usar a estimativa de máxima verossimilhança em vez dos mínimos quadrados comuns? Quais são os pontos fortes e as limitações de cada um? Estou tentando reunir conhecimentos práticos sobre onde usar cada um em situações comuns.



2
Regressão linear vs. não-linear
Eu tenho um conjunto de valores xxx e yyy que são teoricamente relacionados exponencialmente: y=axby=axby = ax^b Uma maneira de obter os coeficientes é aplicando logaritmos naturais em ambos os lados e ajustando um modelo linear: > fit <- lm(log(y)~log(x)) > a <- exp(fit$coefficients[1]) > b <- fit$coefficients[2] Outra maneira …

1
Ao construir um modelo de regressão usando conjuntos de modelagem / validação separados, é apropriado "recircular" os dados de validação?
Suponha que eu tenha uma divisão 80/20 entre observações de modelagem / validação. Ajustei um modelo ao conjunto de dados de modelagem e me sinto confortável com o erro que estou vendo no conjunto de dados de validação. Antes de lançar meu modelo para escorar observações futuras, é apropriado combinar …

1
Variável dependente padronizada dentro de um grupo em modelos de dados em painel?
A padronização de uma variável dependente dentro do grupo de identificação faz sentido? O documento de trabalho a seguir (desaceleração do desmatamento na Amazônia Legal; Preços ou políticas ?, pdf ) usa uma variável dependente padronizada para analisar o efeito da mudança de política geral no Brasil sobre o desmatamento. …

2
Quando registrar / expandir suas variáveis ​​ao usar modelos aleatórios de floresta?
Estou fazendo regressão usando florestas aleatórias para prever preços com base em vários atributos. O código é escrito em Python usando o Scikit-learn. Como você decide se deve transformar suas variáveis ​​usando exp/ logantes de usá-las para se ajustar ao modelo de regressão? É necessário ao usar uma abordagem do …

1
Os erros padrão do bootstrap e os intervalos de confiança são apropriados nas regressões em que a suposição de homoscedasticidade é violada?
Se nas regressões OLS padrão, duas suposições são violadas (distribuição normal de erros, homocedasticidade), o bootstrapping de erros padrão e intervalos de confiança é uma alternativa apropriada para obter resultados significativos com relação à significância dos coeficientes do regressor? Os testes de significância com erros padrão de inicialização e intervalos …





5
Estimando porcentagens como variável dependente na regressão
Eu tenho as porcentagens de classificação dos alunos em 38 exames como a variável dependente no meu estudo. Uma porcentagem de classificação é calculada por (classificação / número de alunos em um exame). Essa variável dependente tem distribuição quase uniforme e eu quero estimar os efeitos de algumas variáveis ​​na …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.