Perguntas com a marcação «r»

R é uma linguagem de programação de código-fonte livre e ambiente de software para computação estatística, bioinformática e gráficos.

15
Python vs R para aprendizado de máquina
Estou apenas começando a desenvolver um aplicativo de aprendizado de máquina para fins acadêmicos. Atualmente, estou usando R e me treinando nele. No entanto, em muitos lugares, vi pessoas usando Python . O que as pessoas estão usando na academia e na indústria e qual é a recomendação?

1
Como obter correlação entre duas variáveis ​​categóricas e uma variável categórica e variável contínua?
Estou construindo um modelo de regressão e preciso calcular o abaixo para verificar se há correlações Correlação entre 2 variáveis ​​categóricas multiníveis Correlação entre uma variável categórica multinível e uma variável contínua VIF (fator de inflação de variância) para variáveis ​​categóricas multiníveis Eu acredito que é errado usar o coeficiente …

9
A linguagem R é adequada para Big Data
R possui muitas bibliotecas destinadas à análise de dados (por exemplo, JAGS, BUGS, ARULES etc.), e são mencionadas em livros populares como: J.Krusche, Doing Bayesian Data Analysis; B.Lantz, "Machine Learning with R". Eu vi uma diretriz de 5 TB para um conjunto de dados ser considerado como Big Data. Minha …
48 bigdata  r 


7
Processos organizados para limpar dados
Do meu limitado interesse pela ciência de dados usando R, percebi que limpar dados ruins é uma parte muito importante da preparação de dados para análise. Existem práticas recomendadas ou processos para limpar dados antes de processá-los? Em caso afirmativo, existem ferramentas automatizadas ou semi-automatizadas que implementam algumas dessas práticas …
34 r  data-cleaning 

1

3
Parâmetros do XGBoost com ajuste otimizado
O XGBoost tem feito um ótimo trabalho quando se trata de lidar com variáveis ​​dependentes categóricas e contínuas. Mas, como seleciono os parâmetros otimizados para um problema no XGBoost? Foi assim que apliquei os parâmetros para um problema recente do Kaggle: param <- list( objective = "reg:linear", booster = "gbtree", …
27 r  python  xgboost 

5
Imagem da VM para projetos de ciência de dados
Como existem inúmeras ferramentas disponíveis para tarefas de ciência de dados, é complicado instalar tudo e criar um sistema perfeito. Existe uma imagem do Linux / Mac OS com Python, R e outras ferramentas de ciência de dados de código aberto instaladas e disponíveis para uso imediato das pessoas? Um …
24 python  r  tools 

9
Algum console do Online R?
Estou procurando um console online para o idioma R. Como se eu escrevesse o código e o servidor fosse executado e me fornecesse a saída. Semelhante ao site Datacamp.
24 r  statistics 


6
O que você usa para gerar um painel no R?
Preciso gerar relatórios periódicos (diários, mensais) do painel de análise da web. Eles serão estáticos e não requerem interação, então imagine um arquivo PDF como saída de destino. Os relatórios mesclam tabelas e gráficos (principalmente gráficos sparkline e bullet criados com o ggplot2). Pense nos painéis do estilo Stephen Few …
17 r  visualization 


5
aumentar o mapa de calor marítimo
Crio um corr()df a partir de um df original. O corr()df saiu 70 X 70 e é impossível de visualizar o mapa de calor ... sns.heatmap(df). Se eu tentar exibir corr = df.corr(), a tabela não se encaixa na tela e posso ver todas as correlações. É uma maneira de …
16 visualization  pandas  plotting  machine-learning  neural-network  svm  decision-trees  svm  efficiency  python  linear-regression  machine-learning  nlp  topic-model  lda  named-entity-recognition  naive-bayes-classifier  association-rules  fuzzy-logic  kaggle  deep-learning  tensorflow  inception  classification  feature-selection  feature-engineering  machine-learning  scikit-learn  tensorflow  keras  encoding  nlp  text-mining  nlp  rnn  python  neural-network  feature-extraction  machine-learning  predictive-modeling  python  r  linear-regression  clustering  r  ggplot2  neural-network  neural-network  training  python  neural-network  deep-learning  rnn  predictive-modeling  databases  sql  programming  distribution  dataset  cross-validation  neural-network  deep-learning  rnn  machine-learning  machine-learning  python  deep-learning  data-mining  tensorflow  visualization  tools  sql  embeddings  orange  feature-extraction  unsupervised-learning  gan  machine-learning  python  data-mining  pandas  machine-learning  data-mining  bigdata  apache-spark  apache-hadoop  deep-learning  python  convnet  keras  aggregation  clustering  k-means  r  random-forest  decision-trees  reference-request  visualization  data  pandas  plotting  neural-network  keras  rnn  theano  deep-learning  tensorflow  inception  predictive-modeling  deep-learning  regression  sentiment-analysis  nlp  encoding  deep-learning  python  scikit-learn  lda  convnet  keras  predictive-modeling  regression  overfitting  regression  svm  prediction  machine-learning  similarity  word2vec  information-retrieval  word-embeddings  neural-network  deep-learning  rnn 

3
Como prever probabilidades no xgboost?
A função de previsão abaixo também fornece valores -ve, portanto não podem ser probabilidades. param <- list(max.depth = 5, eta = 0.01, objective="binary:logistic",subsample=0.9) bst <- xgboost(param, data = x_mat, label = y_mat,nround = 3000) pred_s <- predict(bst, x_mat_s2) Eu google e tentei, pred_s <- predict(bst, x_mat_s2,type="response") mas não funcionou. Questão …

4
R: aprendizado de máquina na GPU
Existem pacotes de aprendizado de máquina para o R que podem usar a GPU para melhorar a velocidade do treinamento (algo como o theano do mundo python)? Vejo que existe um pacote chamado gputools que permite a execução de código na gpu, mas estou procurando uma biblioteca mais completa para …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.