Perguntas com a marcação «classification»

Uma instância de aprendizado supervisionado que identifica a categoria ou categorias às quais uma nova instância do conjunto de dados pertence.

4
Dados multi-classe inclinados
Eu tenho um conjunto de dados que contém ~ 100.000 amostras de 50 classes. Eu tenho usado o SVM com um kernel RBF para treinar e prever novos dados. O problema, porém, é que o conjunto de dados é inclinado para diferentes classes. Por exemplo, Classe 1 - 30 (~ …

1
Dados desequilibrados, causando má classificação no conjunto de dados de várias classes
Estou trabalhando na classificação de texto, onde tenho 39 categorias / classes e 8,5 milhões de registros. (No futuro, dados e categorias aumentarão). Estrutura ou formato dos meus dados é o seguinte. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | Color:black,Display Size:5.5 inch,Internal | 211 …


4
Classificar séries temporais multivariadas
Eu tenho um conjunto de dados composto por séries temporais (8 pontos) com cerca de 40 dimensões (portanto, cada série temporal é 8 por 40). A saída correspondente (os possíveis resultados para as categorias) é igual a 0 ou 1. Qual seria a melhor abordagem para projetar um classificador para …

2
Classificação de sequências de vetores
Meu conjunto de dados é composto por seqüências de vetores. Cada vetor possui 50 dimensões com valor real. O número de vetores em uma sequência varia de 3-5 a 10-15. Em outras palavras, o comprimento de uma sequência não é fixo. Alguma quantidade razoável de seqüências (não vetores!) É anotada …


1
Mineração relacional de dados sem ILP
Eu tenho um grande conjunto de dados de um banco de dados relacional para o qual preciso criar um modelo de classificação. Normalmente, para essa situação, eu usaria a Programação Lógica Indutiva (ILP), mas devido a circunstâncias especiais, não posso fazer isso. A outra maneira de resolver isso seria apenas …

4
Sugerir conjuntos de dados de treinamento do classificador de texto
Quais conjuntos de dados disponíveis gratuitamente posso usar para treinar um classificador de texto? Estamos tentando melhorar o engajamento de nossos usuários, recomendando o conteúdo mais relacionado a ele. Pensamos que, se classificássemos nosso conteúdo com base em um conjunto predefinido de palavras, podemos recomendar a ele que envolva conteúdo, …


1
A confiança do rótulo de treinamento pode ser usada para melhorar a precisão da previsão?
Eu tenho dados de treinamento rotulados com valores binários. Eu também coletei a confiança de cada um desses rótulos, ou seja, 0,8 de confiança significaria que 80% das etiquetadoras humanas concordam com esse rótulo. É possível usar esses dados de confiança para melhorar a precisão do meu classificador? O seguinte …


5
O que são ferramentas úteis de anotação (se houver)
Estou procurando ferramentas que ajudem a mim e à minha equipe a anotar conjuntos de treinamento. Eu trabalho em um ambiente com grandes conjuntos de dados, alguns dos quais são un ou semi-estruturados. Em muitos casos, existem registros que ajudam a encontrar uma verdade fundamentada. Em muitos casos, porém, é …


1
Categorização de abordagens para lidar com classes desequilibradas
Qual é a melhor maneira de categorizar as abordagens desenvolvidas para lidar com o problema de classe de desequilíbrio? Este artigo os categoriza em: Pré-processamento: inclui métodos de superamostragem, subamostragem e híbrido, Aprendizagem sensível ao custo: inclui métodos diretos e meta-aprendizagem, que este último divide em limiar e amostragem, Técnicas …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.