Perguntas com a marcação «data.table»

O pacote R data.table é uma extensão de data.frame construída para análise rápida de dados na memória. Use a tag dt para o pacote DataTables com Shiny (DT).

8
Converta classes de coluna em data.table
Tenho um problema ao usar data.table: Como converter classes de colunas? Aqui está um exemplo simples: Com data.frame não tenho problemas para convertê-lo, com data.table, só não sei como: df <- data.frame(ID=c(rep("A", 5), rep("B",5)), Quarter=c(1:5, 1:5), value=rnorm(10)) #One way: http://stackoverflow.com/questions/2851015/r-convert-data-frame-columns-from-factors-to-characters df <- data.frame(lapply(df, as.character), stringsAsFactors=FALSE) #Another way df[, "value"] <- …
118 r  data.table 

2
Qual é o propósito de definir uma chave em data.table?
Estou usando data.table e há muitas funções que exigem que eu defina uma chave (por exemplo X[Y]). Como tal, desejo entender o que uma chave faz para definir as chaves corretamente em minhas tabelas de dados. Uma fonte que li foi ?setkey. setkey()classifica um data.tablee o marca como classificado. As …
113 r  data.table 

8
Limpando valores `Inf` de um dataframe R
Em R, tenho uma operação que cria alguns Infvalores quando transformo um dataframe. Eu gostaria de transformar esses Infvalores em NAvalores. O código que tenho é lento para grandes dados. Existe uma maneira mais rápida de fazer isso? Digamos que eu tenha o seguinte dataframe: dat <- data.frame(a=c(1, Inf), b=c(Inf, …
101 r  dataframe  data.table 



6
Obtendo os melhores valores por grupo
Aqui está um exemplo de quadro de dados: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Eu quero que o subconjunto dcontenha as linhas com os 5 principais valores de xpara cada valor de grp. Usando a base R, minha abordagem seria algo como: ordered <- d[order(d$x, …
92 r  data.table  dplyr 

4
dplyr em data.table, estou realmente usando data.table?
Se eu usar a sintaxe dplyr no topo de uma tabela de dados , obtenho todos os benefícios de velocidade da tabela de dados enquanto ainda uso a sintaxe de dplyr? Em outras palavras, eu uso indevidamente a tabela de dados se a consultar com a sintaxe dplyr? Ou preciso …
89 r  data.table  dplyr 


5
Divida a string de texto em colunas data.table
Eu tenho um script que lê os dados de um arquivo CSV em um data.tablee divide o texto em uma coluna em várias colunas novas. Atualmente, estou usando as funções lapplye strsplitpara fazer isso. Aqui está um exemplo: library("data.table") df = data.table(PREFIX = c("A_B","A_C","A_D","B_A","B_C","B_D"), VALUE = 1:6) dt = as.data.table(df) …
86 r  data.table 

7
Como aplicar a mesma função a cada coluna especificada em uma data.table
Eu tenho um data.table com o qual gostaria de realizar a mesma operação em certas colunas. Os nomes dessas colunas são fornecidos em um vetor de caracteres. Neste exemplo específico, gostaria de multiplicar todas essas colunas por -1. Alguns dados de brinquedo e um vetor especificando colunas relevantes: library(data.table) dt …
86 r  data.table 

12
dplyr altera / substitui várias colunas em um subconjunto de linhas
Estou tentando um fluxo de trabalho baseado em dplyr (em vez de usar principalmente data.table, ao qual estou acostumado) e me deparei com um problema para o qual não consigo encontrar uma solução dplyr equivalente para . Normalmente, encontro o cenário em que preciso atualizar / substituir condicionalmente várias colunas …
86 r  data.table  dplyr 

5
data.table interpolando linearmente os valores de NA sem grupos
Eu queria preencher alguns valores de NA em uma tabela de dados sem grupos. Por favor, considere este extrato de data.table representando tempo e distâncias: library(data.table) df <- data.frame(time = seq(7173, 7195, 1), dist = c(31091.33, NA, 31100.00, 31103.27, NA, NA, NA, NA, 31124.98, NA,31132.81, NA, NA, NA, NA, 31154.19, …
18 r  data.table 



6
dividir colunas de caracteres e obter nomes de campo na string
Eu preciso dividir uma coluna que contém informações em várias colunas. Eu usaria, tstrsplitmas o mesmo tipo de informação não está na mesma ordem entre as linhas e preciso extrair o nome da nova coluna dentro da variável. Importante saber: pode haver muitas informações (campos para se tornarem novas variáveis) …
11 r  data.table  reshape 

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.