Perguntas com a marcação «data-mining»

A mineração de dados usa métodos da inteligência artificial em um contexto de banco de dados para descobrir padrões anteriormente desconhecidos. Como tal, os métodos geralmente não são supervisionados. Está intimamente relacionado, mas não é idêntico ao aprendizado de máquina. As principais tarefas da mineração de dados são análise de cluster, detecção de outlier e mineração de regras de associação.


8
Execute o agrupamento K-means (ou seus parentes próximos) com apenas uma matriz de distância, não dados de pontos por recurso
Quero executar o agrupamento K-means nos objetos que tenho, mas os objetos não são descritos como pontos no espaço, ou seja, por objects x featuresconjunto de dados. No entanto, sou capaz de calcular a distância entre dois objetos (ela se baseia em uma função de similaridade). Então, eu descarto a …


3
Primeiro passo para big data (
Suponha que você esteja analisando um enorme conjunto de dados na ordem de bilhões de observações por dia, em que cada observação possui algumas milhares de variáveis ​​numéricas e categoriais esparsas e possivelmente redundantes. Digamos que exista um problema de regressão, um problema de classificação binária desequilibrada e uma tarefa …

4
As árvores de decisão quase sempre são binárias?
Quase todo exemplo de árvore de decisão que encontrei é uma árvore binária. Isso é praticamente universal? A maioria dos algoritmos padrão (C4.5, CART etc.) suporta apenas árvores binárias? Pelo que entendi, CHAID não se limita a árvores binárias, mas isso parece ser uma exceção. Uma divisão bidirecional seguida por …





2
Função "Interessante" para perguntas do StackExchange
Esta pergunta foi migrada do Mathematics Stack Exchange porque pode ser respondida em Validação cruzada. Migrou há 8 anos . Estou tentando montar um pacote de mineração de dados para sites StackExchange e, em particular, estou tentando determinar as perguntas "mais interessantes". Gostaria de usar a pontuação da pergunta, mas …

1
Supervisão distante: supervisionada, semi-supervisionada ou ambas?
"Supervisão à distância" é um esquema de aprendizado no qual um classificador é aprendido, devido a um conjunto de treinamento pouco rotulado (os dados de treinamento são rotulados automaticamente com base em heurísticas / regras). Penso que tanto a aprendizagem supervisionada quanto a semi-supervisionada podem incluir essa "supervisão distante" se …


3
Qual é a diferença prática entre regras de associação e árvores de decisão na mineração de dados?
Existe uma descrição realmente simples das diferenças práticas entre essas duas técnicas? Ambos parecem ser usados ​​para aprendizado supervisionado (embora as regras de associação também possam lidar com supervisão). Ambos podem ser usados ​​para previsão O mais próximo que encontrei de uma descrição 'boa' é do livro de texto Statsoft …



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.