Perguntas com a marcação «standardization»

Geralmente, refere-se à "padronização z", que está alterando e redimensionando os dados para garantir que eles tenham média zero e variação unitária. Outras "padronizações" também são possíveis.

7
Ao realizar uma regressão múltipla, quando você deve centralizar suas variáveis ​​preditoras e quando deve padronizá-las?
Em alguma literatura, li que uma regressão com múltiplas variáveis ​​explicativas, se em unidades diferentes, precisava ser padronizada. (A padronização consiste em subtrair a média e dividir pelo desvio padrão.) Em quais outros casos eu preciso padronizar meus dados? Existem casos em que eu deveria centralizar apenas meus dados (ou …



3
Executar a normalização de recursos antes ou dentro da validação do modelo?
Uma boa prática comum no Machine Learning é apresentar normalização ou padronização de dados das variáveis ​​preditoras, é isso, centralizar os dados subtraindo a média e normalizá-los dividindo pela variação (ou desvio padrão também). Para auto-contenção e para minha compreensão, fazemos isso para alcançar duas coisas principais: Evite pesos de …

1
Como aplicar a padronização / normalização ao treinamento e ao conjunto de testes se a previsão é o objetivo?
Transformo todos os meus dados ou dobras (se o CV for aplicado) ao mesmo tempo? por exemplo (allData - mean(allData)) / sd(allData) Transformo trainset e testset separadamente? por exemplo (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) Ou eu transformo o trainset e uso cálculos no testset? por …



3
se deve redimensionar o indicador / binário / preditores fictícios para o LASSO
Para o LASSO (e outros procedimentos de seleção de modelo), é crucial redimensionar os preditores. A recomendação geral que sigo é simplesmente usar uma média de 0, 1 normalização de desvio padrão para variáveis ​​contínuas. Mas o que há com manequins? Por exemplo, alguns exemplos aplicados da mesma (excelente) escola …

2
A padronização antes de Lasso é realmente necessária?
Eu li três razões principais para padronizar variáveis ​​antes de algo como Lassoregressão: 1) Interpretabilidade dos coeficientes. 2) Capacidade de classificar a importância do coeficiente pela magnitude relativa das estimativas de coeficiente pós-retração. 3) Não há necessidade de interceptação. Mas estou pensando no ponto mais importante. Temos motivos para pensar …


3
O que significa “normalização” e como verificar se uma amostra ou uma distribuição está normalizada?
Eu tenho uma pergunta na qual ele pede para verificar se a distribuição Uniform ( ) está normalizada.Uniform(a,b)Uniform(a,b){\rm Uniform}(a,b) Por um lado, o que significa que qualquer distribuição seja normalizada? E segundo, como vamos verificar se uma distribuição é normalizada ou não? Entendo que ao calcular obtemos dados normalizados , …

2
Pergunta sobre padronização na regressão de cume
Ei pessoal, encontrei um ou dois trabalhos que usam regressão de cume (para dados de basquete). Sempre me disseram para padronizar minhas variáveis ​​se eu fizesse uma regressão de crista, mas simplesmente me disseram para fazer isso porque a crista era uma variante de escala (a regressão da crista não …




Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.