Perguntas com a marcação «classification»

A classificação estatística é o problema de identificar a subpopulação à qual novas observações pertencem, onde a identidade da subpopulação é desconhecida, com base em um conjunto de dados de treinamento contendo observações cuja subpopulação é conhecida. Portanto, essas classificações mostrarão um comportamento variável que pode ser estudado por estatísticas.

1
Como o LDA, uma técnica de classificação, também serve como técnica de redução de dimensionalidade como o PCA
Neste artigo , o autor vincula a análise discriminante linear (LDA) à análise de componentes principais (PCA). Com meu conhecimento limitado, não sou capaz de acompanhar como o LDA pode ser um pouco semelhante ao PCA. Eu sempre pensei que o LDA era uma forma de algoritmo de classificação, semelhante …

2
A floresta aleatória está super ajustada?
Estou experimentando florestas aleatórias com o scikit-learn e estou obtendo ótimos resultados do meu conjunto de treinamento, mas resultados relativamente ruins no meu conjunto de testes ... Aqui está o problema (inspirado no poker) que estou tentando resolver: Dadas as cartas do jogador A, as cartas do jogador B e …

3
Aprendizagem semi-supervisionada, aprendizagem ativa e aprendizagem profunda para classificação
Edição final com todos os recursos atualizados: Para um projeto, estou aplicando algoritmos de aprendizado de máquina para classificação. Desafio: dados rotulados bastante limitados e muito mais dados não rotulados. Metas: Aplicar classificação semi-supervisionada Aplique um processo de rotulagem semi-supervisionado (conhecido como aprendizado ativo) Encontrei muitas informações de trabalhos de …



5
Classificação de texto em grande escala
Estou procurando fazer uma classificação nos meus dados de texto. Tenho 300 classes200 documentos de treinamento por turma (mais ou menos 60000 documents in total) e é provável que isso resulte em dados dimensionais muito altos (podemos estar olhando além das dimensões de 1 milhão ). Gostaria de executar as …

10
Conjuntos de dados de redes sociais
Bloqueado . Esta pergunta e suas respostas estão bloqueadas porque a questão está fora do tópico, mas tem um significado histórico. No momento, não está aceitando novas respostas ou interações. Estou procurando conjuntos de dados de redes sociais (twitter, friendfeed, facebook, lastfm etc.) para tarefas de classificação, de preferência no …


2
Classificação de teste em dados de desequilíbrio superamostrados
Estou trabalhando em dados gravemente desequilibrados. Na literatura, vários métodos são utilizados para reequilibrar os dados usando re-amostragem (super ou sub-amostragem). Duas boas abordagens são: SMOTE: Técnica de sobre-amostragem de minorias sintéticas ( SMOTE ) ADASYN: Abordagem de Amostra Sintética Adaptativa para Aprendizagem Desequilibrada ( ADASYN ) Eu implementei o …






2
Por que o classificador de regressão de cume funciona muito bem para a classificação de texto?
Durante um experimento para classificação de texto, eu encontrei o classificador de cume gerando resultados que constantemente superam os testes entre os classificadores que são mais comumente mencionados e aplicados para tarefas de mineração de texto, como SVM, NB, kNN, etc. Embora eu não tenha elaborado na otimização de cada …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.