Perguntas com a marcação «scikit-learn»

Uma biblioteca de aprendizado de máquina para Python. Use essa tag para qualquer pergunta no tópico que (a) envolva o scikit-learn como parte crítica da pergunta ou resposta esperada, & (b) não seja apenas sobre como usar o scikit-learn.

1
Por que a maioria dos meus pontos é classificada como ruído usando o DBSCAN?
Estou usando vários algoritmos de cluster do sklearn para agrupar alguns dados e não consigo descobrir o que está acontecendo com o DBSCAN. Meus dados são uma matriz de termos de documento do TfidfVectorizer, com algumas centenas de documentos pré-processados. Código: tfv = TfidfVectorizer(stop_words=STOP_WORDS, tokenizer=StemTokenizer()) data = tfv.fit_transform(dataset) db = …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.