Perguntas com a marcação «data.table»

O pacote R data.table é uma extensão de data.frame construída para análise rápida de dados na memória. Use a tag dt para o pacote DataTables com Shiny (DT).

3
data.table vs dplyr: um pode fazer algo bem, o outro não pode ou faz mal?
Visão geral Estou relativamente familiarizado data.table, não muito dplyr. Eu li algumas dplyrvinhetas e exemplos que apareceram no SO, e até agora minhas conclusões são as seguintes: data.tablee dplyrsão comparáveis ​​em velocidade, exceto quando existem muitos grupos (ou seja,> 10-100K) e em outras circunstâncias (consulte os benchmarks abaixo) dplyr tem …
760 r  data.table  dplyr 

8
Como você exclui uma coluna pelo nome em data.table?
Para se livrar de uma coluna chamada "foo" em a data.frame, eu posso fazer: df <- df[-grep('foo', colnames(df))] No entanto, uma vez dfconvertido em um data.tableobjeto, não há como remover apenas uma coluna. Exemplo: df <- data.frame(id = 1:100, foo = rnorm(100)) df2 <- df[-grep('foo', colnames(df))] # works df3 <- …
195 r  data.table 

2
Entendendo exatamente quando uma tabela de dados é uma referência a (contra uma cópia de) outra tabela de dados
Estou com problemas para entender as propriedades de passagem por referência de data.table. Algumas operações parecem 'quebrar' a referência e eu gostaria de entender exatamente o que está acontecendo. Ao criar um a data.tablepartir de outro data.table(via <-, e atualizando a nova tabela por :=, a tabela original também é …

3
O que .SD representa em data.table em R
.SDparece útil, mas eu realmente não sei o que estou fazendo com isso. O que significa? Por que existe um período anterior (ponto final). O que está acontecendo quando eu o uso? Eu li: .SDé um data.tablecontendo o subconjunto de xdados de cada grupo, excluindo as colunas do grupo. Pode …
173 r  data.table 



6
Como excluir uma linha por referência em data.table?
Minha pergunta está relacionada à atribuição por referência versus cópia data.table. Quero saber se é possível excluir linhas por referência, semelhante a DT[ , someCol := NULL] Eu quero saber sobre DT[someRow := NULL, ] Eu acho que há uma boa razão para que essa função não exista, então talvez …
150 r  data.table 



17
Substituindo NAs pelo valor mais recente não NA
Em um data.frame (ou data.table), eu gostaria de "preencher" NAs com o valor anterior não NA mais próximo. Um exemplo simples, usando vetores (em vez de a data.frame) é o seguinte: > y <- c(NA, 2, 2, NA, NA, 3, NA, 4, NA, NA) Eu gostaria de uma função fill.NAs()que …
141 r  data.table  zoo  r-faq 

2
Por que rbindlist é "melhor" que rbind?
Estou examinando a documentação data.tablee também notei em algumas das conversas aqui no SO que rbindlistdeveriam ser melhores do que rbind. Gostaria de saber por que é rbindlistmelhor do que rbinde em quais cenários rbindlistrealmente supera rbind? Existe alguma vantagem em termos de utilização de memória?
135 r  data.table  rbind  rbindlist 


3
Classificar linhas em data.table em ordem decrescente na chave da string `order (-x, v)` gera erro no data.table 1.9.4 ou anterior
Digamos que eu tenho o seguinte data.tableem R: library(data.table) DT = data.table(x=rep(c("b","a","c"),each=3), y=c(1,3,6), v=1:9) Quero ordená-lo por duas colunas (digamos colunas xe v). Eu usei isso: DT[order(x,v)] # sorts first by x then by v (both in ascending order) Mas agora, quero classificá-lo por x(em ordem decrescente) e ter o …
125 r  string  sorting  data.table  key 


2
Como reordenar colunas data.table (sem copiar)
Gostaria de reordenar as colunas no meu data.table x, dado um vetor de caracteres de nomes de coluna neworder: library(data.table) x <- data.table(a = 1:3, b = 3:1, c = runif(3)) neworder <- c("c", "b", "a") Obviamente, eu poderia fazer: x[ , neworder, with = FALSE] # or x[ , …
118 r  data.table 

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.