Perguntas com a marcação «r»

R é uma linguagem de programação de código-fonte livre e ambiente de software para computação estatística, bioinformática e gráficos.


2
Ganho de informações em R
Encontrei pacotes sendo usados ​​para calcular o "Ganho de Informações" para selecionar os principais atributos na Árvore de Decisão C4.5 e tentei usá-los para calcular o "Ganho de Informações". Mas os resultados do cálculo de cada pacote são diferentes, como no código abaixo. > IG.CORElearn <- attrEval(In_Occu ~ In_Temp+In_Humi+In_CO2+In_Illu+In_LP+Out_Temp+Out_Humi, dataUSE1, …


4
Classificação de email em R
Estou trabalhando em um projeto no R onde tenho cerca de 1200 e-mails de uma empresa, a maioria rotulada como classe11_{1} ou classe22_{2}, que são os tipos de solicitações. Cerca de 1000 e-mails são rotulados como classe11_{1}e 200 são rotulados como classe22_{2}. Meu objetivo é usar o aprendizado supervisionado para …




2
visualizar um gráfico de caixa horizontal em R
Eu tenho um conjunto de dados como este. Os dados foram coletados através de um questionário e eu vou fazer algumas análises exploratórias. windows <- c("yes", "no","yes","yes","no") sql <- c("no","yes","no","no","no") excel <- c("yes","yes","yes","no","yes") salary <- c(100,200,300,400,500 ) test<- as.data.frame (cbind(windows,sql,excel,salary),stringsAsFactors=TRUE) test[,"salary"] <- as.numeric(as.character(test[,"salary"] )) Eu tenho uma variável de resultado …

1
Erro R usando o pacote tm (mineração de texto)
Estou tentando usar o pacote tm para converter um vetor de seqüências de texto em um elemento corpus. Meu código se parece com isso Corpus(d1$Yes) onde d1$Yesé um fator com 124 níveis, cada um contendo uma sequência de texto. Por exemplo, d1$Yes[246] = "So we can get the boat out!" …
8 r  text-mining 

2
Identificando "Clusters" ou "Grupos" em uma Matriz
Eu tenho uma matriz que é preenchida com elementos discretos e preciso agrupá-los (usando R) em grupos intactos. Então, por exemplo, considere esta matriz: [A B B C A] [A A B A A] [A B B C C] [A A A A A] Haveria dois clusters separados para A, …
7 r  clustering 

2
Sistema de recomendação com base no histórico de compras, não nas classificações
Estou explorando opções para sistemas de recomendação otimizados para o setor de seguros, o que levaria em consideração i) explorações de produtos ii) características do usuário (segmento, idade, riqueza, etc.). Eu quero enfatizar isso a) não há classificações de produtos disponíveis, portanto a filtragem colaborativa não é uma opção b) …


1
Por que a regressão logística no Spark e R retorna modelos diferentes para os mesmos dados?
Comparei os modelos de regressão logística em R ( glm) e Spark (LogisticRegressionWithLBFGS ) em um conjunto de dados de 390 obs. de 14 variáveis. Os resultados são completamente diferentes na interceptação e nos pesos. Como explicar isso? Aqui estão os resultados do Spark (LogisticRegressionWithLBFGS): model.intercept : 1.119830027739959 model.weights : …

1
Como o SQL Server Analysis Services se compara ao R?
Pode ser uma pergunta muito ampla com opiniões pesadas, mas estou realmente achando difícil buscar informações sobre a execução de vários algoritmos usando projetos de mineração de dados do SQL Server Analysis Service versus usando R. Isso ocorre principalmente porque todos os profissionais de ciência de dados com quem trabalho …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.