Perguntas com a marcação «regression»

Técnicas para analisar o relacionamento entre uma (ou mais) variáveis ​​"dependentes" e variáveis ​​"independentes".





4
Por que os métodos de regressão Mínimos Quadrados e Máxima Verossimilhança não são equivalentes quando os erros não são normalmente distribuídos?
O título diz tudo. Entendo que os mínimos quadrados e a máxima verossimilhança fornecerão o mesmo resultado para os coeficientes de regressão se os erros do modelo forem normalmente distribuídos. Mas, o que acontece se os erros não forem normalmente distribuídos? Por que os dois métodos não são mais equivalentes?


2
A divisão dos dados em conjuntos de teste e treinamento é puramente uma coisa de "estatísticas"?
Eu sou um estudante de física estudando aprendizado de máquina / ciência de dados, por isso não pretendo que esta pergunta inicie conflitos :) No entanto, uma grande parte de qualquer programa de graduação em física é fazer laboratórios / experimentos, o que significa muitos dados processamento e análise estatística. …

1
Como interpretar os resultados quando o cume e o laço executam bem separadamente, mas produzem coeficientes diferentes
Estou executando um modelo de regressão com Lasso e Ridge (para prever uma variável de resultado discreto variando de 0 a 5). Antes de executar o modelo, uso o SelectKBestmétodo de scikit-learnpara reduzir o conjunto de recursos de 250 para 25 . Sem uma seleção inicial de recursos, Lasso e …


2
Se o encolhimento é aplicado de maneira inteligente, ele sempre funciona melhor para estimadores mais eficientes?
Suponha que eu tenho dois estimadores e que são estimadores consistentes do mesmo parâmetro e que com no sentido psd. Portanto, assintoticamente é mais eficiente que . Esses dois estimadores são baseados em diferentes funções de perda. β 2β0√βˆ1β^1\widehat{\beta}_1βˆ2β^2\widehat{\beta}_2β0 0β0\beta_0V1≤V2 β 1 β 2n--√( βˆ1- β0 0) →dN( 0 , …

3
Regressão com dados assimétricos
Tentando calcular a contagem de visitas de dados demográficos e de serviço. Os dados estão muito distorcidos. Histogramas: gráficos qq (à esquerda é log): m <- lm(d$Visits~d$Age+d$Gender+city+service) m <- lm(log(d$Visits)~d$Age+d$Gender+city+service) citye servicesão variáveis ​​fatoriais. Eu recebo um valor p baixo *** para todas as variáveis, mas também recebo um r-quadrado …





Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.