Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


5
LDA vs word2vec
Estou tentando entender qual é a semelhança entre Alocação de Dirichlet Latente e word2vec para calcular a similaridade de palavras. Pelo que entendi, o LDA mapeia palavras para um vetor de probabilidades de tópicos latentes , enquanto o word2vec as mapeia para um vetor de números reais (relacionado à decomposição …

4
Replicando a opção "robusta" da Stata em R
Eu tenho tentado replicar os resultados da opção Stata robustem R. Eu usei o rlmcomando do pacote MASS e também o comando lmrobdo pacote "robustbase". Nos dois casos, os resultados são bem diferentes da opção "robusta" no Stata. Alguém pode sugerir algo neste contexto? Aqui estão os resultados obtidos quando …




1
Classificação em R - ordem descendente [fechado]
Eu estou procurando classificar dados que, em alguns casos, o valor maior tem a classificação 1. Eu sou relativamente novo em R, mas não vejo como posso ajustar essa configuração na função de classificação. x <- c(23,45,12,67,34,89) rank(x) gera: [1] 2 4 1 5 3 6 quando eu quero que …
39 r 





3
Por que as árvores de decisão não são computacionalmente caras?
Em Introdução ao aprendizado estatístico com aplicações em R , os autores escrevem que o ajuste de uma árvore de decisão é muito rápido, mas isso não faz sentido para mim. O algoritmo precisa passar por todos os recursos e particioná-lo de todas as maneiras possíveis para encontrar a divisão …
38 cart 

6
Por que recebo uma árvore de decisão com 100% de precisão?
Estou obtendo uma precisão de 100% para minha árvore de decisão. O que estou fazendo errado? Este é o meu código: import pandas as pd import json import numpy as np import sklearn import matplotlib.pyplot as plt data = np.loadtxt("/Users/Nadjla/Downloads/allInteractionsnum.csv", delimiter=',') x = data[0:14] y = data[-1] from sklearn.cross_validation import …

4
Para plotar com R, devo aprender ggplot2 ou ggvis?
Para plotar com R, devo aprender ggplot2 ou ggvis? Não quero necessariamente aprender os dois se um deles for superior em qualquer aspecto. Por que a comunidade R continua criando novos pacotes com funcionalidades sobrepostas? A publicação do blog de introdução não menciona uma palavra por que o ggvis é …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.