Perguntas com a marcação «model-selection»

A seleção de modelos é um problema de julgar qual modelo de algum conjunto apresenta o melhor desempenho. Os métodos populares incluemR2, Critérios AIC e BIC, conjuntos de testes e validação cruzada. Até certo ponto, a seleção de recursos é um subproblema da seleção de modelos.



1
Intervalos de confiança ao usar o teorema de Bayes
Estou computando algumas probabilidades condicionais e intervalos de confiança associados a 95%. Para muitos de meus casos, tenho contagens diretas de xsucessos fora dos ntestes (de uma tabela de contingência), para que eu possa usar um intervalo de confiança binomial, como é fornecido por binom.confint(x, n, method='exact')in R. Em outros …




1
Diferença exata entre os modelos de duas partes (por exemplo, Cragg) e os modelos Tobit tipo 2 (por exemplo, Heckman)
Quero executar uma regressão em que DV seja a quantia de financiamento (em dólares americanos) obtida pelas startups. Naturalmente, o DV contém muitos zeros (~ 55%) e tem uma distribuição contínua para y> 0. Em geral, meu entendimento é que o modelo Tobit (ou uma variação dele) é apropriado para …

1
Validação cruzada para regressão líquida elástica: erro ao quadrado vs. correlação no conjunto de testes
Considere regressão líquida elástica com glmnetparametrização semelhante à função de perdaL=12n∥∥y−β0−Xβ∥∥2+λ(α∥β∥1+(1−α)∥β∥22/2).L=12n‖y−β0−Xβ‖2+λ(α‖β‖1+(1−α)‖β‖22/2).\mathcal L = \frac{1}{2n}\big\lVert y - \beta_0-X\beta\big\rVert^2 + \lambda\big(\alpha\lVert \beta\rVert_1 + (1-\alpha) \lVert \beta\rVert^2_2/2\big).Eu tenho um conjunto de dados com n≪pn≪pn\ll p (44 e 3000 respectivamente) e estou usando a validação cruzada de 11 vezes repetida para selecionar os parâmetros …

2
Os pressupostos do modelo de teste são considerados p-hacking / fishing?
"P-hacking", "fishing" e "garden of bifurcação", como explicado aqui e aqui, descrevem um estilo exploratório de análise de dados, semelhante a uma pesquisa que produz estimativas tendenciosas. O teste de premissas do modelo (por exemplo, normalidade, homocedasticidade em regressão) usa testes estatísticos no mesmo conjunto de dados usado para ajustar …

1
A inferência baseada no modelo de regressão completo (global) é apropriada?
A inferência é baseada em um modelo completo e, em caso afirmativo, em que circunstâncias? Suponha que você esteja interessado no relacionamento potencial entre uma variável de resposta e várias variáveis ​​preditoras de candidatos e use alguma forma de regressão (por exemplo, modelo linear generalizado) para responder a isso. Uma …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.