Perguntas com a marcação «dplyr»

Use esta tag para questões relacionadas às funções do pacote dplyr, como group_by, sumarizar, filtrar e selecionar.

3
data.table vs dplyr: um pode fazer algo bem, o outro não pode ou faz mal?
Visão geral Estou relativamente familiarizado data.table, não muito dplyr. Eu li algumas dplyrvinhetas e exemplos que apareceram no SO, e até agora minhas conclusões são as seguintes: data.tablee dplyrsão comparáveis ​​em velocidade, exceto quando existem muitos grupos (ou seja,> 10-100K) e em outras circunstâncias (consulte os benchmarks abaixo) dplyr tem …
760 r  data.table  dplyr 

5
Exibir / imprimir todas as linhas de uma rampa (tbl_df)
tibble(anteriormente tbl_df) é uma versão de um quadro de dados criado pelo dplyrpacote de manipulação do quadro de dados em R. Ele evita saídas longas da tabela ao chamar acidentalmente o quadro de dados. Depois que um quadro de dados é agrupado por tibble/ tbl_df, existe um comando para exibir …
192 r  dplyr  options  display 

4
Filtrar linhas que contêm uma determinada sequência
Eu tenho que filtrar um quadro de dados usando como critério a linha na qual está a string RTB. Estou usando dplyr. d.del <- df %.% group_by(TrackingPixel) %.% summarise(MonthDelivery = as.integer(sum(Revenue))) %.% arrange(desc(MonthDelivery)) Eu sei que posso usar a função filter, dplyrmas não sei exatamente como pedir para verificar o …
188 r  filter  dplyr 


7
Extrair uma coluna dplyr tbl como um vetor
Existe uma maneira mais sucinta de obter uma coluna de um dplyr tbl como vetor, de um tbl com back-end de banco de dados (ou seja, o quadro / tabela de dados não pode ser subconjunto diretamente)? require(dplyr) db <- src_sqlite(tempfile(), create = TRUE) iris2 <- copy_to(db, iris) iris2$Species # …

8
Corrigindo um aviso múltiplo "coluna desconhecida"
Eu tenho um aviso múltiplo persistente de "coluna desconhecida" para todos os tipos de comandos (por exemplo, str (x) para instalar atualizações em pacotes) e não tenho certeza de como depurar isso ou corrigi-lo. O aviso "coluna desconhecida" está claramente relacionado a uma variável em um tbl_df que eu renomeei, …
170 r  dplyr 

9
Use nomes de variáveis ​​dinâmicas no `dplyr`
Eu quero usar dplyr::mutate()para criar várias novas colunas em um quadro de dados. Os nomes das colunas e seu conteúdo devem ser gerados dinamicamente. Dados de exemplo da íris: library(dplyr) iris <- tbl_df(iris) Eu criei uma função para alterar minhas novas colunas da Petal.Widthvariável: multipetal <- function(df, n) { varname …
168 r  dplyr  r-faq 

9
Agrupe por várias colunas no dplyr, usando a entrada de vetor de sequência
Estou tentando transferir meu entendimento do plyr para o dplyr, mas não consigo descobrir como agrupar por várias colunas. # make data with weird column names that can't be hard coded data = data.frame( asihckhdoydkhxiydfgfTgdsx = sample(LETTERS[1:3], 100, replace=TRUE), a30mvxigxkghc5cdsvxvyv0ja = sample(LETTERS[1:3], 100, replace=TRUE), value = rnorm(100) ) # get …
157 r  dplyr  r-faq 

7
Frequências / proporções relativas com dplyr
Suponha que eu queira calcular a proporção de valores diferentes dentro de cada grupo. Por exemplo, usando os mtcarsdados, como faço para calcular a frequência relativa do número de marchas por am (automático / manual) de uma só vez dplyr? library(dplyr) data(mtcars) mtcars <- tbl_df(mtcars) # count frequency mtcars %>% …
153 r  group-by  dplyr  frequency 

9
Selecione a primeira e a última linha dos dados agrupados
Questão Usando dplyr, como faço para selecionar as observações / linhas superior e inferior dos dados agrupados em uma instrução? Dados e exemplo Dado um quadro de dados df <- data.frame(id=c(1,1,1,2,2,2,3,3,3), stopId=c("a","b","c","a","b","c","a","b","c"), stopSequence=c(1,2,3,3,1,4,3,1,2)) Posso obter as observações superior e inferior de cada grupo usando slice, mas usando duas declarações separadas: …
137 r  dplyr 

6
Remova linhas duplicadas usando o dplyr
Eu tenho um data.frame assim - set.seed(123) df = data.frame(x=sample(0:1,10,replace=T),y=sample(0:1,10,replace=T),z=1:10) > df x y z 1 0 1 1 2 1 0 2 3 0 1 3 4 1 1 4 5 1 0 5 6 0 1 6 7 1 0 7 8 1 0 8 9 1 0 …
128 r  dplyr 

6
Aplicando uma função a todas as linhas de uma tabela usando o dplyr?
Ao trabalhar com plyr, muitas vezes achei útil usar adplypara funções escalares que tenho que aplicar a cada linha. por exemplo data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)) ) Sepal.Length Sepal.Width Petal.Length Petal.Width Species Max.Len 1 5.1 3.5 1.4 0.2 setosa 5.1 2 4.9 3.0 1.4 0.2 setosa …
121 r  plyr  dplyr 


6
Substituição para “renomear” no dplyr
Eu gosto da função de renomeação de plyr rename. Recentemente comecei a usar o dplyr e gostaria de saber se existe uma maneira fácil de renomear variáveis ​​usando uma função de dplyr, que seja tão fácil de usar quanto a de plyr rename?
118 r  rename  dplyr 

1
Como interpretar a mensagem dplyr `sumize ()` reagrupando a saída por 'x' (sobrescrever com o argumento `.groups`)?
Comecei a receber uma nova mensagem (veja o título da postagem) ao executar group_by e summary () após atualizar para a versão de desenvolvimento dplyr 0.8.99.9003. Aqui está um exemplo para recriar a saída: library(tidyverse) library(hablar) df <- read_csv("year, week, rat_house_females, rat_house_males, mouse_wild_females, mouse_wild_males 2018,10,1,1,1,1 2018,10,1,1,1,1 2018,11,2,2,2,2 2018,11,2,2,2,2 2019,10,3,3,3,3 2019,10,3,3,3,3 …
112 r  dplyr  summarize 

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.