Perguntas com a marcação «dplyr»

Use esta tag para questões relacionadas às funções do pacote dplyr, como group_by, sumarizar, filtrar e selecionar.

1
O dplyr pode se unir em várias colunas ou chave composta?
Sei que a dplyrv3.0 permite que você junte variáveis ​​diferentes: left_join(x, y, by = c("a" = "b")vai combinar x.acomy.b No entanto, é possível juntar em uma combinação de variáveis ​​ou eu tenho que adicionar uma chave composta antes? Algo assim: left_join(x, y, by = c("a c" = "b d")para combinar …
111 r  dplyr 

5
Reúna vários conjuntos de colunas
Tenho dados de uma pesquisa online em que os entrevistados fazem uma série de perguntas de 1 a 3 vezes. O software de pesquisa (Qualtrics) registra esses dados em várias colunas, ou seja, Q3.2 na pesquisa terá colunasQ3.2.1. , Q3.2.2.e Q3.2.3.: df <- data.frame( id = 1:10, time = as.Date('2009-01-01') …
108 r  reshape  dplyr  qualtrics  tidyr 

6
Soma em várias colunas com dplyr
Minha pergunta envolve somar valores em várias colunas de um quadro de dados e criar uma nova coluna correspondente a esse somatório usando dplyr. As entradas de dados nas colunas são binárias (0,1). Estou pensando em um análogo de linha da função summarise_eachou mutate_eachde dplyr. Abaixo está um exemplo mínimo …
103 r  dplyr 

6
filtrar para casos completos em data.frame usando dplyr (exclusão por caso)
É possível filtrar um data.frame para casos completos usando dplyr? complete.casescom uma lista de todas as variáveis ​​funciona, é claro. Mas isso é a) detalhado quando há muitas variáveis ​​eb) impossível quando os nomes das variáveis ​​não são conhecidos (por exemplo, em uma função que processa qualquer data.frame). library(dplyr) df …
97 r  dplyr  magrittr 

4
dplyr resumize: Equivalente a “.drop = FALSE” para manter os grupos com comprimento zero na saída
Ao usar summarisecom plyr's ddplyfunção, categorias vazias são descartados por padrão. Você pode alterar esse comportamento adicionando .drop = FALSE. No entanto, isso não funciona ao usar summarisecom dplyr. Existe outra maneira de manter categorias vazias no resultado? Aqui está um exemplo com dados falsos. library(dplyr) df = data.frame(a=rep(1:3,4), b=rep(1:2,6)) …
97 r  dplyr  plyr  tidyr 


8
R dplyr: eliminar várias colunas
Eu tenho um dataframe e uma lista de colunas nesse dataframe que gostaria de descartar. Vamos usar o irisconjunto de dados como exemplo. Eu gostaria de deixar cair Sepal.Lengthe Sepal.Widthe utilizar apenas as colunas restantes. Como faço isso usando selectou select_do dplyrpacote? Aqui está o que tentei até agora: drop.cols …
96 r  dplyr 

5
R Avaliação condicional ao usar o operador de tubo%>%
Ao usar o operador pipe %>%com pacotes tais como dplyr, ggvis, dycharts, etc, como eu faço um passo condicionalmente? Por exemplo; step_1 %>% step_2 %>% if(condition) step_3 Essas abordagens não parecem funcionar: step_1 %>% step_2 if(condition) %>% step_3 step_1 %>% step_2 %>% if(condition) step_3 Existe um longo caminho: if(condition) { …
96 r  dplyr  ggvis  magrittr 

6
Obtendo os melhores valores por grupo
Aqui está um exemplo de quadro de dados: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Eu quero que o subconjunto dcontenha as linhas com os 5 principais valores de xpara cada valor de grp. Usando a base R, minha abordagem seria algo como: ordered <- d[order(d$x, …
92 r  data.table  dplyr 

2
Como especificar nomes de colunas para xey ao juntar em dplyr?
Tenho dois frames de dados que desejo unir usando dplyr. Um é um quadro de dados contendo os primeiros nomes. test_data <- data.frame(first_name = c("john", "bill", "madison", "abby", "zzz"), stringsAsFactors = FALSE) O outro quadro de dados contém uma versão limpa do corpus de nomes de Kantrowitz, identificando o gênero. …
91 r  join  left-join  dplyr 

4
dplyr em data.table, estou realmente usando data.table?
Se eu usar a sintaxe dplyr no topo de uma tabela de dados , obtenho todos os benefícios de velocidade da tabela de dados enquanto ainda uso a sintaxe de dplyr? Em outras palavras, eu uso indevidamente a tabela de dados se a consultar com a sintaxe dplyr? Ou preciso …
89 r  data.table  dplyr 

3
dplyr muda com valores condicionais
Em um grande dataframe ("myfile") com quatro colunas, tenho que adicionar uma quinta coluna com valores condicionalmente baseados nas primeiras quatro colunas. Prefira respostas com dplyr e mutate, principalmente por causa de sua velocidade em grandes conjuntos de dados. Meu dataframe é parecido com este: V1 V2 V3 V4 1 …
87 r  dplyr  mutate 

12
dplyr altera / substitui várias colunas em um subconjunto de linhas
Estou tentando um fluxo de trabalho baseado em dplyr (em vez de usar principalmente data.table, ao qual estou acostumado) e me deparei com um problema para o qual não consigo encontrar uma solução dplyr equivalente para . Normalmente, encontro o cenário em que preciso atualizar / substituir condicionalmente várias colunas …
86 r  data.table  dplyr 

7
Como substituir NA por conjunto de valores
Eu tenho o seguinte quadro de dados: library(dplyr) library(tibble) df <- tibble( source = c("a", "b", "c", "d", "e"), score = c(10, 5, NA, 3, NA ) ) df Se parece com isso: # A tibble: 5 x 2 source score <chr> <dbl> 1 a 10 . # current max …
18 r  dplyr  tibble 


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.