Perguntas com a marcação «overfitting»

O erro de modelagem (especialmente erro de amostragem) em vez de relacionamentos replicáveis ​​e informativos entre variáveis ​​melhora as estatísticas de ajuste do modelo, mas reduz a parcimônia e piora a validade explicativa e preditiva.


1

1
Como selecionar o melhor ajuste sem excesso de dados? Modelando uma distribuição bimodal com N funções normais, etc
Tenho uma distribuição de valores obviamente bimodal, que procuro ajustar. Os dados podem ser ajustados bem com 2 funções normais (bimodal) ou com 3 funções normais. Além disso, há uma razão física plausível para ajustar os dados com 3. Quanto mais parâmetros forem introduzidos, mais perfeito será o ajuste, como …


4
Sobreajuste com classificadores lineares
Hoje, nosso professor declarou em sala de aula que "não é possível adaptar demais aos classificadores lineares". Considero que isso está errado, uma vez que até os classificadores lineares podem ser sensíveis a outliers no conjunto de treinamento - por exemplo, uma margem rígida Support Vector Machine: Um único ponto …



2
Explicação lúcida para “estabilidade numérica da inversão da matriz” na regressão de crista e seu papel na redução do excesso de ajuste
Entendo que podemos empregar regularização em um problema de regressão de mínimos quadrados como w∗=argminw[(y−Xw)T(y−Xw)+λ∥w∥2]w∗=argminw⁡[(y−Xw)T(y−Xw)+λ‖w‖2]\boldsymbol{w}^* = \operatorname*{argmin}_w \left[ (\mathbf y-\mathbf{Xw})^T(\boldsymbol{y}-\mathbf{Xw}) + \lambda\|\boldsymbol{w}\|^2 \right] e que esse problema tem uma solução de formulário fechado como: w^=(XTX+λI)−1XTy.w^=(XTX+λI)−1XTy.\hat{\boldsymbol{w}} = (\boldsymbol{X}^T\boldsymbol{X}+\lambda\boldsymbol{I})^{-1}\boldsymbol{X}^T\boldsymbol{y}. Vemos que na 2ª equação, a regularização está simplesmente adicionando λλ\lambda à diagonal …






1
Técnicas para detectar sobreajuste
Eu tive uma entrevista de emprego para uma posição de ciência de dados. Durante a entrevista, perguntaram-me o que devo fazer para garantir que o modelo não seja ajustado demais. Minha primeira resposta foi usar a validação cruzada para avaliar o desempenho do modelo. No entanto, o entrevistador disse que …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.