Perguntas com a marcação «data-mining»

A mineração de dados usa métodos da inteligência artificial em um contexto de banco de dados para descobrir padrões anteriormente desconhecidos. Como tal, os métodos geralmente não são supervisionados. Está intimamente relacionado, mas não é idêntico ao aprendizado de máquina. As principais tarefas da mineração de dados são análise de cluster, detecção de outlier e mineração de regras de associação.


2
Quais são as aplicações práticas conhecidas e existentes da teoria do caos na mineração de dados?
Enquanto lia casualmente algum mercado de massa trabalha com a teoria do caos nos últimos anos, comecei a me perguntar como vários aspectos dele poderiam ser aplicados à mineração de dados e campos relacionados, como redes neurais, reconhecimento de padrões, gerenciamento de incertezas etc. deparamos com tão poucos exemplos de …

3
A floresta aleatória e o reforço são paramétricos ou não paramétricos?
Lendo a excelente modelagem estatística: As duas culturas (Breiman 2001) , podemos aproveitar toda a diferença entre modelos estatísticos tradicionais (por exemplo, regressão linear) e algoritmos de aprendizado de máquina (por exemplo, Bagging, Random Forest, Boosted trees ...). Breiman critica os modelos de dados (paramétricos) porque eles se baseiam na …

2
Até que ponto o auto-estudo me leva?
Nunca participei de um curso oficial ou estruturado de análise de dados ou aprendizado de máquina (além das ofertas on-line recentes) e aprendi a maior parte do que sei lendo e testando as coisas. Sei que estou longe de conseguir um emprego. Minha pergunta não é o que é melhor …




3
Preciso descartar variáveis ​​correlacionadas / colineares antes de executar kmeans?
Estou executando kmeans para identificar grupos de clientes. Eu tenho aproximadamente 100 variáveis ​​para identificar clusters. Cada uma dessas variáveis ​​representa a% de gasto de um cliente em uma categoria. Portanto, se eu tiver 100 categorias, tenho essas 100 variáveis, de modo que a soma dessas variáveis ​​seja 100% para …

4
Melhores maneiras de agregar e analisar dados
Tendo recentemente começado a me ensinar Machine Learning e Análise de Dados, estou me deparando com uma parede de tijolos sobre a necessidade de criar e consultar grandes conjuntos de dados. Gostaria de pegar os dados que agreguei na minha vida profissional e pessoal e analisá-los, mas não tenho certeza …

3
A ideia de fazer com que os dados tenham média zero
Costumo ver pessoas que fazem com que uma dimensão / recurso de um conjunto de dados seja de média zero, removendo a média de todos os elementos. Mas eu nunca entendi por que fazer isso? Qual é o efeito de fazer isso como uma etapa de pré-processamento? Melhora o desempenho …



1



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.