Perguntas com a marcação «data-preprocessing»

1
Codificação one-hot vs dummy no Scikit-learn
Existem duas maneiras diferentes de codificar variáveis ​​categóricas. Digamos, uma variável categórica tem n valores. A codificação one-hot converte-a em n variáveis, enquanto a codificação fictícia converte-a em n-1 variáveis. Se tivermos k variáveis ​​categóricas, cada uma com n valores. Uma codificação quente termina com variáveis kn , enquanto a …





2
O que é bucketização?
Eu tenho procurado uma explicação clara de "bucketização" no aprendizado de máquina sem sorte. O que eu entendo até agora é que a bucketização é semelhante à quantização no processamento de sinal digital, onde uma faixa de valores contínuos é substituída por um valor discreto. Isso está correto? Quais são …

2
Por que muitas pessoas desejam transformar dados distorcidos em dados distribuídos normais para aplicativos de aprendizado de máquina?
Para dados de imagem e tabulares, muitas pessoas transformam os dados distorcidos em dados normalmente distribuídos durante o pré-processamento. O que a distribuição normal significa no aprendizado de máquina? É uma suposição essencial de algoritmos de aprendizado de máquina? Até os dados da imagem, vi transformação quantil, que transforma todos …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.