Perguntas com a marcação «categorical-encoding»

Representando variáveis ​​categóricas como conjuntos de variáveis ​​numéricas. Necessário em muitos tipos de análise para que processem dados categóricos. Um exemplo comum é usar um preditor categórico em regressão / ANOVA por meio de codificação fictícia, codificação de efeito, codificação Helmert, contrastes definidos pelo usuário, etc.




1
Descartar uma das colunas ao usar a codificação hot-one
Meu entendimento é que no aprendizado de máquina pode ser um problema se o seu conjunto de dados tiver recursos altamente correlacionados, pois codificam efetivamente as mesmas informações. Recentemente, alguém apontou que, quando você codifica uma variável quente em uma variável categórica, você acaba com recursos correlatos; portanto, você deve …

3
Quando se deve usar regressão múltipla com codificação fictícia vs. ANCOVA?
Analisei recentemente um experimento que manipulou 2 variáveis ​​categóricas e uma variável contínua usando ANCOVA. No entanto, um revisor sugeriu que a regressão múltipla com a variável categórica codificada como variáveis ​​dummy é um teste mais apropriado para experimentos com variáveis ​​categóricas e contínuas. Quando é apropriado usar ANCOVA vs. …


5
Como recodificar variável categórica em variável numérica ao usar SVM ou Rede Neural
Para usar o SVM ou a Rede Neural, ele precisa transformar (codificar) variáveis ​​categóricas em variáveis ​​numéricas, o método normal nesse caso é usar 0-1 valores binários com o k-ésimo valor categórico transformado em (0,0, .. ., 1,0, ... 0) (1 está na posição k-ésima). Existem outros métodos para fazer …

1
Como tratar preditores categóricos no LASSO
Estou executando um LASSO que possui alguns preditores de variáveis ​​categóricos e outros contínuos. Eu tenho uma pergunta sobre as variáveis ​​categóricas. O primeiro passo que entendo é dividir cada um deles em manequins, padronizá-los para uma penalização justa e depois regredir. Várias opções surgem para o tratamento das variáveis …

2
A codificação qualitativa de variáveis ​​na regressão leva a "singularidades"
Eu tenho uma variável independente chamada "qualidade"; essa variável possui 3 modalidades de resposta (má qualidade; média qualidade; alta qualidade). Quero introduzir essa variável independente em minha regressão linear múltipla. Quando eu tenho uma variável independente binária (variável dummy, eu posso codificar 0/ 1), é fácil introduzi-la em um modelo …


2
Como fazer regressão com codificação de efeito em vez de codificação fictícia em R?
Atualmente, estou trabalhando em um modelo de regressão em que tenho apenas variáveis ​​categóricas / fatoriais como variáveis ​​independentes. Minha variável dependente é uma proporção transformada em logit. É bastante fácil apenas executar uma regressão normal em R, pois R sabe automaticamente como codificar manequins assim que eles são do …

1
Quais são os diferentes tipos de codificação disponíveis para variáveis ​​categóricas (em R) e quando você as utilizaria?
Se você ajustar um modelo linear ou um modelo misto, existem diferentes tipos de codificação disponíveis para transformar uma variedade categórica ou nominal em um número de variáveis ​​para as quais os parâmetros são estimados, como a dummy conding (o padrão R) e a codificação de efeitos. Ouvi dizer que …




Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.