Eu tenho um dataframe e uma lista de colunas nesse dataframe que gostaria de descartar. Vamos usar o iris
conjunto de dados como exemplo. Eu gostaria de deixar cair Sepal.Length
e Sepal.Width
e utilizar apenas as colunas restantes. Como faço isso usando select
ou select_
do dplyr
pacote?
Aqui está o que tentei até agora:
drop.cols <- c('Sepal.Length', 'Sepal.Width')
iris %>% select(-drop.cols)
Erro em -drop.cols: argumento inválido para operador unário
iris %>% select_(.dots = -drop.cols)
Erro em -drop.cols: argumento inválido para operador unário
iris %>% select(!drop.cols)
Erro em! Drop.cols: tipo de argumento inválido
iris %>% select_(.dots = !drop.cols)
Erro em! Drop.cols: tipo de argumento inválido
Sinto que estou perdendo algo óbvio, porque parece uma operação muito útil que já deveria existir. No Github, alguém postou um problema semelhante , e Hadley disse para usar 'indexação negativa'. Isso é o que (eu acho) eu tentei, mas sem sucesso. Alguma sugestão?
iris
, mas não no meu dataframe real (iris
foi um exemplo de brinquedo). Meu dataframe contém 4558 linhas e 147 colunas. A mensagem de erro que recebi foiError in eval(x$expr, data, x$env) : variable names are limited to 10000 bytes
. Alguma ideia de por que isso pode estar acontecendo?